( tl; dr ainda respondendo ao ping é um comportamento esperado, verifique seu uso de memória)
As solicitações de eco ICMP (ou seja, ping) são tratadas pela pilha de rede do kernel, sem nenhuma outra dependência.
O kernel é conhecido como "residente na memória", o que significa que ele sempre será mantido na RAM e não pode ser trocado para o disco como um aplicativo normal pode.
Isso significa que, em situações em que você está sem memória física, os aplicativos são trocados para o disco, mas o kernel permanece onde está. Quando a memória física e a de troca estão cheias (e o sistema não consegue gerenciar seus programas por muito tempo), a máquina irá cair. No entanto, porque a) o kernel ainda está na memória e b) ele pode responder às solicitações de ping sem a ajuda de qualquer outra coisa, o sistema continuará respondendo ao ping apesar de tudo estar morto.
Em relação ao seu problema, suspeito strongmente de problemas de memória. Instale o "sysstat" e use o comando "sar" para ver um log de memória / cpu / load / io load etc. Eu esperaria que, no momento da falha, você veria ambos os 100% físicos e swap usados.
Eu também consideraria olhar para dmesg ou / var / log / messages para qualquer sinal de OOM-killer (killer sem memória) sendo invocado . Este é o sistema de emergência do kernel que começará a matar processos no caso de a memória estar esgotada. Sua eficácia depende em grande parte dos processos que estão sendo mortos. Um único processo consumindo a memória será eficientemente eliminado e a memória liberada, no entanto, um site baseado em apache gerará processos de substituição assim que um processo filho for morto.