Uma breve atualização sobre isso: Após a atualização para o kernel LTS mais novo (4.4.39), o servidor está estável. Uptime 19 dias agora, então eu acho que nós conseguimos. Embora não saibamos realmente a causa raiz, achamos que o kernel do CentOS 7 (3.10) pode ser muito antigo para alguns hardwares modernos. Como não podemos fornecer uma mensagem de erro útil (como um kernel panic no melhor dos casos), decidimos não reportar isso aos desenvolvedores do CentOS.