Meus instintos me dizem que este é um problema de hardware, possivelmente relacionado à temperatura (como aparece depois de algum tempo de execução). Muito provavelmente você tem um problema com o southbridge ou hardware relacionado.
Considere executar alguns testes de transação extensivos no southbridge ou simplesmente substituir a placa-mãe.
O fato de seu SO permanecer estável, mas você tem erros aleatórios de E / S, normalmente elimina a CPU / Memória, pois erros nesses sistemas tendem a fazer com que o SO trava e queime junto com o outro software. Mas a maioria do Kernel é lido do disco na inicialização e nunca é trocado, portanto, um sistema Linux pode ser surpreendentemente estável, mesmo que não possa ser lido adequadamente a partir do disco.