Esta página da Red Hat descreve o que é sosreport
e como você pode monitorar e controlá-lo.
The sosreport command is a tool that collects configuration and diagnostic information from a Red Hat Enterprise Linux system. For instance: the running kernel version, loaded modules, and system and service configuration files. The command also runs external programs to collect further information and stores this output in the resulting archive.
To run sosreport the sos package must be installed. The package is part of the default group and will be installed automatically on most systems.
Registros
Eu costumo começar a passar por /var/log/messages
ou /var/log/secure
apenas para me confortar que nada de nefasto está acontecendo. Depois disso, recomendo uma reinicialização.
Software
Não há muito mais a sugerir que outros continuem examinando o sistema mais do que o normal e fique de olho nas coisas.
Hardware
Eu também levaria algum tempo para garantir que não seja um problema de hardware. Eu usaria memtest86+
que você pode inicializar a partir de um liveCD e depois rodar por um período de tempo para ter certeza de que não foi é um DIMM RAM ruim que é o culpado.
Considerações finais
Eu normalmente suspeito do software 60% do tempo e do hardware em 40% do tempo, então eu me concentro em possíveis soluções de software como os logs, você pode querer ver se você tem atualizações pendentes ( yum check
). Não os aplique, mas apenas veja se você está atualizado. Uma atualização em um sistema com hardware com falha só piorará as coisas.
Se você está bem perto de estar atualizado, eu diagnostico com o memtest86 + em seguida. Planeje a desativação do sistema por algumas horas enquanto isso é executado.