apache php-fpm - max_children alcançado - servidor sem resposta até o php-fpm reiniciar

2

Um dos nossos servidores com uma configuração muito especial é muito sensível a um evento desconhecido.

Hardware:

  • Xen - VM
  • 22 núcleos (criados com o Intel xeon 4 * 6 Core)
  • SSD do RAID 6
  • 60 GB de RAM

Configuração:

  • Suse Openlinux 13.1
  • Apache2.4 - evento
  • PHP 5.5.14
  • mod_proxy_fcgi
  • php-fpm
  • 5.5.33-MariaDB

Carga de trabalho:

  • espalhados por 120 sites diferentes
  • cerca de 60 dos 120 são Typo3-Sites (o resto também é controlado por php)

A questão:

Mas, às vezes, como exemplo, quando temos uma tarefa de backup incluindo o mysqldump em execução, temos o problema de que um após o outro do virtualhosts sinalize um "max_children alcançado" e pare de responder. Claro que fazemos o backup em tempos de baixo tráfego e aceitaríamos pouco tempo "sem resposta", mas esse impasse ou bloqueio nunca termina sozinho. Tudo está bem depois de um reinício manual do php-fpm.

O comportamento normal deste sistema, mesmo em tempos de tráfego intenso, é impecável e rápido. A maioria dos núcleos é ideling e os outros parâmetros que eu sei são ok.

É claro que não há insinuações de arquivo de log nem no log de mensagens (exceto o "max_children reach") nem em qualquer um dos logs do apache / vhosts. E sim, o uso de memória e os processos abertos aumentam rapidamente.

Alguém teve um cenário como o nosso (eu sei que existem muitas coisas especiais dentro deste monstro) e tive os mesmos problemas ou uma boa idéia de como depurar este problema?

    
por Hawkeye 16.09.2014 / 17:38

0 respostas