O servidor está me fornecendo uma falha SMART prevista

1

Eu tenho um xSeries 306 antigo que começou a me dar uma mensagem Falha de SMART prevista no disco rígido 2: porta SATA 0 , um aviso sobre o backup e uma mensagem para Pressione F1 para continuar . No meu entender, a SMART é na verdade parte do disco rígido, mas isso acontece com discos rígidos que funcionam bem em outros sistemas. Coloquei um novo disco rígido e estou tentando reinstalar o servidor 2003 (ainda recebo o aviso SMART). O instalador vê o disco rígido e eu chego até a formatação da unidade. Apenas trava em 0%. Suponho que este não seja realmente o computador que detecta um problema SMART, mas um problema com o próprio servidor. Alguma idéia além de uma placa-mãe ruim do que poderia causar isso?

A propósito, este sistema tem apenas 1 disco rígido. Eu nunca notei que ele seja referenciado como "disco rígido 2: porta SATA 0". Isso é normal?

obrigado

    
por Jeff 22.12.2011 / 15:19

4 respostas

1

Sim, as métricas SMART são reunidas pelo firmware da unidade e, como tal, são independentes de qual sistema elas são colocadas.

No entanto, o fato de alguns sistemas reclamarem e alguns não tem nada a ver com as razões acima mencionadas.

É simplesmente o SO ou aplicativo de monitoramento que decide o que essas métricas significam .

EDIT: bem, não totalmente - o SMART também fornece um status de PASSA / FALHA de valor único que o sistema operacional ou aplicativo pode verificar, e esse status é determinado pelo firmware da unidade.

No entanto, qualquer solução de monitoramento que valha a pena não apenas usará isso, mas também interpretará os valores reais da tabela SMART.

    
por 22.12.2011 / 16:01
1

Esses alertas SMART estão sendo exibidos por um motivo.

Sim, o disco rígido em si tem o circuito / lógica SMART nele. Ele mede muitas métricas de desempenho diferentes, como tempo de giro, setores defeituosos, etc. etc. Há inúmeras ferramentas gratuitas on-line para obter facilmente esses dados e ver por si mesmo.

O instalador do Windows não se importa com os dados SMART.

    
por 22.12.2011 / 15:23
1

As variáveis SMART são fornecidas pelo firmware da unidade. Quando certos parâmetros ultrapassam os limites definidos, a máquina deve começar a chorar. Isso não tem nada para ddo em um nível de sistema operacional. É totalyl no firmware da unidade.

Isto NÃO significa que o disco é uma porcaria - significa que o disco começa a ter problemas. Pode funcionar bem nos próximos anos ou falhar em poucos dias.

Assim, para máquinas / servidores profissionais em que a integridade dos dados é importante, é prática reverter o disco no momento em que o SMART começa a chorar SE você o validar é um problema SMART (pode ser problema de violação / controlador - visto um disco interferir com outras portas ona um bus SAS).

I've never noticed it being referenced as "hard disk 2: SATA Port 0". Is that normal?

Possivelmente. Verifique o que mais está lá de acordo com o BIOS. Por exemplo, o meu servidor principal tem 2 teclados - um real, um do gerenciamento de luzes que vem através de uma porta usb "falsa". Talvez você tenha algum "fantasma" hd 0? Drive de DVD?

    
por 22.12.2011 / 15:26
0

Outros notaram, com razão, que o SMART é uma função na unidade. Pode ser que outros chassis não reclamem deste HDD porque eles não verificam seu status SMART na inicialização.

Como eu tenho anotado em uma resposta anterior , O Google publicou um artigo alguns anos atrás sobre ( inter alia ) o monitoramento SMART, e uma conclusão foi que a presença de erros SMART se correlaciona strongmente com a falha incipiente do disco.

Naturalmente, isso é apenas um argumento estatístico, mas se eu fosse você, eu colocaria esse HDD em uma caixa Linux, use smartctl para confirmar que a unidade realmente está relatando falhas previstas e imediatamente aposente a unidade.

    
por 22.12.2011 / 15:58