Como verificar erros de hardware com métodos de software?

5

Como posso verificar se há blocos defeituosos, memória incorreta etc. usando apenas soluções de software? Estou usando o Ubuntu 11.04.

    
por LanceBaynes 08.06.2011 / 15:57

2 respostas

5

Confira badblocks se você quiser um utilitário especificamente projetado para gravar / ler cada LBA de uma unidade, testando erros no caminho. badblocks oferece testes não destrutivos e destrutivos (como observado abaixo, não é muito útil em discos rígidos modernos).

Se você quiser acompanhar os parâmetros SMART da sua unidade, confira smartctl .

Não há nenhum software completo de teste de memória que eu saiba que funcione enquanto o Linux está rodando, mas você pode inicializar no memtest86 +, que é um utilitário bem respeitado que dá à sua RAM um bom teste.

A compilação de um kernel Linux enfatiza tanto a CPU quanto a RAM em alto grau. Se você receber erros em locais aleatórios durante o processo (em oposição a erros reproduzíveis) durante a compilação, isso pode indicar um problema de RAM ou CPU.

Existe também um utilitário chamado stress que pode saturar seu sistema com threads, fazendo com que o uso da CPU permaneça alto se você quiser testar sua CPU.

lm-sensors , quando configurado corretamente, permite ver coisas como temperaturas, velocidade do ventilador e qualquer sensor de tensão a bordo.

    
por 08.06.2011 / 16:37
3

Observe que você deve observar a saída do utilitário dmesg durante a execução dos testes de memória / estresse da CPU. Você verá mensagens de erro desagradáveis do kernel se houver erros de memória, especialmente se o hardware estiver equipado com o recurso ECC.

    
por 09.06.2011 / 04:14