Compreendendo o S.M.A.R.T. valores de um dispositivo Synology 1812+

4

Eu tenho um Synology 1812+ NAS com 8 drives de 3 TB configurados como RAID 5. Seu DSM 4.1 em execução. Foi adquirido para substituir unidades USB, consolidar o armazenamento e backups de curto prazo do OS X usando o Time Machine. O dispositivo e as unidades têm apenas dois meses de idade.

A cada duas semanas, comecei a receber erros de IO de duas das unidades. Os logs apresentam o seguinte erro:

Read error at internal disk [3] sector 2586312968.

e mais tarde

Bad sector at md2 disk3 sector 250049936 has been corrected.

Os setores nunca coincidem. A recomendação é executar um S.M.A.R.T. teste nas unidades. Eu fiz e este é os valores que eu tenho:

EuentãoexecuteiumS.M.A.R.T.testeemumadasunidadesparaasquaisnãorecebireclamaçõeseaquiestãoosvaloresquerecebi:

Os valores parecem muito semelhantes. Não está claro para mim se há um problema e se não, qual é o ponto de um S.M.A.R.T. teste se não revela nenhum problema real? Como devo interpretar esses resultados e quando devo saber o momento de substituir o HDD?

    
por bloudraak 19.10.2012 / 08:20

2 respostas

1

a coluna de dados brutos geralmente representa o número de eventos ocorridos. Por exemplo, o número de erros de leitura na primeira linha. No entanto, os números são tão altos que eu suponho que você tenha um disco da Seagate, que sempre informa valores altos de erro brutos anormais (também quando o disco rígido está OK).

O que mais você pode ver - coluna de status. Está tudo bem para todos os parâmetros, o que significa exatamente o mesmo - sua unidade geralmente está boa.

Conforme escrito no link , a coluna VALUE apresenta um "valor normalizado" atual, que deve ser sempre maior do que o limite.

Assim, seus dados SMART mostram que todas as unidades estão em ordem. No entanto, se você obtiver muitos erros de leitura (não apenas um encontrado nos logs do ano passado :), parece que sua unidade irá morrer em breve. É de alguma forma "normal" ter vários (até 1-2 mil, veja Quantas realocações do setor SMART indicam problemas? ) setores defeituosos na unidade que serão substituídos por outros e, portanto, corrigidos. Mas se você tem muitas dessas mensagens ou elas vêm com muita frequência, você deve substituir sua unidade.

Provavelmente, você pode fazer testes SMART ou outros testes (ambos dependem do seu NAS) ... Por exemplo, se você tiver o smartctl e puder fazer o login no NAS via ssh, tente:

# smartctl -t short /dev/<device>

Este comando irá executar um teste curto para a unidade selecionada. Depois que terminar, você poderá ver resultados com

# smartctl -H /dev/<device>
# smartctl -l selftest /dev/<device>
    
por 02.01.2013 / 12:05
0

Eu tenho outra opção que você poderia tentar, eu descobri que eu tinha um problema parecido com meu DS1812 e um amigo meu também com seu DS1512, se as unidades são novas e você está recebendo esses erros, pode ser que você tenha alguns blocos ruins nas unidades quando você criou os volumes pela primeira vez (o que é normal, a propósito) e se você não escolher a opção verificar se há blocos defeituosos ao criar o volume, o Synology ignora essa etapa e realmente não lida com o mau blocos nas unidades.

Como tal, você recebe esses erros. Assumindo que seu volume pode lidar com 2 falhas de unidade e ainda continuar funcionando, você pode extrair uma unidade defeituosa de cada vez, deixando as outras boas no NAS juntamente com uma das ruins, usando um adaptador USB ou conectando a unidade diretamente , coloque a unidade defeituosa que você acabou de puxar do seu NAS para outro computador e verifique a integridade da unidade nele a partir desse computador.

Talvez, se você tiver uma caixa do Windows, possa executar o CHKDSK ou o checkdisk, assim que a tarefa for concluída, verifique se há algum problema, se não, formate a unidade defeituosa do Synology NAS com o NTFS e coloque-a de volta Quando você fizer isso, instruirá o NAS a reparar o volume e, nesse estágio, o NAS reformatará a unidade para o sistema de arquivos que você está usando no NAS e também procurará e consertará os blocos defeituosos.

Quando a primeira unidade estiver concluída e o volume tiver sido reparado, repita essas etapas com a segunda "unidade defeituosa", com qualquer sorte que você não receba mais esses erros de E / S. Eu percebi este pequeno truque quando eu encontrei pela primeira vez o mesmo tipo de erro de E / S de erros como você está recebendo e agora tudo está bem, o mesmo aconteceu com o meu amigo quando eu o fiz executar estes passos.

Boa sorte, espero que isso ajude você.

    
por 09.06.2013 / 18:07