Por que você acha que o problema está no hardware? Será que o software atinge uma condição sob a qual produz uma falha de segmentação?
Se você realmente quiser saber se tem ou não um problema com a memória, eu sugiro que você procure ECC
erros em /var/adm/messages
logs ou no console remoto, se tiver um. Você também pode executar Memtest86 que no Ubuntu é instalado por padrão e está disponível no menu de inicialização, eu não tenho certeza sobre o Debian, mas poderia ser o mesmo.
Você não pode descartar a falha de programação sob nenhuma circunstância até provar que não há outro motivo para falha. O software executado em outros servidores seria apenas um indicador se:
- O software executa exatamente a mesma função
- Serviços de software, o mesmo número de solicitações
- Serviços de software as solicitações exatamente iguais
- A configuração do software é 100% idêntica
- A configuração do SO fora dos drivers de hardware é 100% idêntica
Fora disso, eu começaria com a análise do núcleo para ver se o software falha no mesmo lugar todas as vezes.