Varnish 503 Guru Erros de mediação com pfsense e apache saudável

1

Estamos executando um firewall pfsense / balanceador de carga com verniz como serviço, na frente de servidores web Fedora Linux executando o Apache.

Estamos recebendo erros de mediação de 503 guru intermitentes. Estamos um pouco presos coçando nossas cabeças porque não é facilmente repetível. Os tempos limite são ajustados para 30s (conectar e primeiro byte), mas a página 503 será mostrada instantaneamente, não depois dos 30s. Então, se você atualizar imediatamente, pode muito bem funcionar instantaneamente e, às vezes, por 100 atualizações.

A média de carga nos servidores da web é < 1, o servidor de banco de dados é < 3 (todos os servidores (web, db, pfsense / verniz) são físicos em vez de VM.

Eu teria pensado que se os tempos limite estivessem sendo atingidos, a página 503 só apareceria depois dos 30s. Eu estou enganado?

Além disso, quando ocorre um erro, não parece haver nenhum erro correspondente nos arquivos de log do apache.

Isso parece afetar tanto as páginas quanto as imagens, por isso é possível fazer com que a página seja carregada corretamente e que 9/10 imagens na página fiquem bem, mas 1 não funciona

Um exemplo da depuração do verniz está abaixo. Ele diz que não há conexão de backend, mas não consigo descobrir por que, se a carga estava alta no apache, eu podia entender que era esquisito

As máquinas estão no mesmo gig ethernet lan

21 ReqStart     c *IP-REMOVED* 33418 1274368062
21 RxRequest    c GET
21 RxURL        c /fashion/
21 RxProtocol   c HTTP/1.1
21 RxHeader     c User-Agent: Mozilla/5.0 (X11; U; Linux x86_64; en-US; rv:1.9.0.5) Gecko/2008121622 Fedora/3.0.5-1.fc10 Firefox/3.0.5
21 RxHeader     c Host: *ourdomain.com*
21 RxHeader     c Accept: */*
21 RxHeader     c Accept-Encoding: deflate, gzip
21 VCL_call     c recv lookup
21 VCL_call     c hash
21 Hash         c /fashion/
21 Hash         c *ourdomain.com*
21 VCL_return   c hash
21 VCL_call     c miss fetch
21 FetchError   c no backend connection
21 VCL_call     c error restart
21 VCL_call     c recv lookup
21 VCL_call     c hash
21 Hash         c /fashion/
21 Hash         c *ourdomain.com*
21 VCL_return   c hash
21 VCL_call     c miss fetch
21 FetchError   c no backend connection
21 VCL_call     c error restart
21 VCL_call     c recv lookup
21 VCL_call     c hash
21 Hash         c /fashion/
21 Hash         c *ourdomain.com*
21 VCL_return   c hash
21 VCL_call     c miss fetch
21 FetchError   c no backend connection
21 VCL_call     c error deliver
21 VCL_call     c deliver deliver
21 TxProtocol   c HTTP/1.1
21 TxStatus     c 503
21 TxResponse   c Service Unavailable
21 TxHeader     c Server: Varnish
21 TxHeader     c Content-Type: text/html; charset=utf-8
21 TxHeader     c Content-Length: 384
21 TxHeader     c Accept-Ranges: bytes
21 TxHeader     c Date: Wed, 11 Apr 2012 10:36:17 GMT
21 TxHeader     c X-Varnish: 1274368062
21 TxHeader     c Age: 0
21 TxHeader     c Via: 1.1 varnish
21 TxHeader     c Connection: close
21 TxHeader     c X-Cache: MISS
21 Length       c 384
21 ReqEnd       c 1274368062 1334140577.449995041 1334140577.450334787 1.794108152 0.000282764 0.000056982
    
por Fammy 11.04.2012 / 12:49

1 resposta

1

Você pode se conectar com o telnet da máquina que está executando o verniz para o IP / port apache está sendo executado, quando os 503s aparecem? A máquina ou o processo de verniz talvez ficasse sem filtros de texto? O apache talvez acertou os MaxClients? Quais são os valores de backend_unhealthy, backend_busy, backend_fail (consulte link também). Você usa sondas de saúde com verniz?

    
por 11.04.2012 / 13:25