nos últimos 3 dias, minha máquina AWS Ubuntu 16 normalmente estável sofreu segfaults Apache2 a cada meia hora ou mais.
Vou pegar centenas de linhas deste logado:
[Tue Dec 19 03:13:49.457390 2017] [core:notice] [pid 6983] AH00051: child pid 8179 exit signal Segmentation fault (11), possible coredump in /etc/apache2
Eu posso ver exatamente quando começou, mas não consigo ver qual é o gatilho.
Não fizemos nenhuma atualização ou alteração por algumas semanas, e nossa carga no site não parece ter aumentado.
Qual é a melhor maneira de monitorar e rastrear o que está ocorrendo?
Eu mudei algumas das configurações do PHP, pois parece que estava acontecendo ao mesmo tempo em que o script sessionclean estava sendo executado.
Eu mudei o gc_probability, e agora estou recebendo o erro abaixo, então reverti a alteração
[Thu Dec 21 22:02:32.126754 2017] [:error] [pid 7536] [client 185.188.204.3:4446 > 5] PHP Notice: Unknown: ps_files_cleanup_dir: opendir(/var/lib/php/sessions) failed: Permission denied (13) in Unknown on line 0
Parece que as permissões estão relacionadas, mas nada foi alterado.
Distributor ID: Ubuntu
Description: Ubuntu 16.04.3 LTS
Release: 16.04
Codename: xenial
PHP 7.0.22-0ubuntu0.16.04.1 (cli) ( NTS )
Copyright (c) 1997-2017 The PHP Group
Zend Engine v3.0.0, Copyright (c) 1998-2017 Zend Technologies
with Zend OPcache v7.0.22-0ubuntu0.16.04.1, Copyright (c) 1999-2017, by Zend Technologies
mysql Ver 14.14 Distrib 5.7.20, for Linux (x86_64) using EditLine wrapper
Server version: Apache/2.4.18 (Ubuntu)
Server built: 2017-09-18T15:09:02
ubuntu@ip-172-31-42-165:~$
Não havia nada incomum nos registros de acesso ou nos syslogs no momento da primeira falha, mas tem sido bastante constante desde então.
Onde você sugere que eu comece a procurar - certamente não é o momento ideal!
[Tue Dec 19 03:13:49.457390 2017] [core:notice] [pid 6983] AH00051: child pid 8179 exit signal Segmentation fault (11), possible coredump in /etc/apache2
[Tue Dec 19 03:13:50.458558 2017] [core:notice] [pid 6983] AH00051: child pid 8229 exit signal Segmentation fault (11), possible coredump in /etc/apache2
[Tue Dec 19 03:13:51.458998 2017] [core:notice] [pid 6983] AH00051: child pid 8024 exit signal Segmentation fault (11), possible coredump in /etc/apache2
[Tue Dec 19 03:13:51.459049 2017] [core:notice] [pid 6983] AH00051: child pid 8204 exit signal Segmentation fault (11), possible coredump in /etc/apache2
A única coisa que eu tentei mudar foi forçar o proprietário a / var / lib / php / sessions para ser www-data (mas já estava) As permissões são:
drwx-wx-wt 2 www-data www-data 143360 Dec 21 22:18 sessions