QNAP reinicia a cada 16 horas ou mais

5

Eu tenho um QNAP TS-412. Tem 4 unidades WD Red 4TB em RAID10.

O coitado funciona muito bem. Praticamente 24 horas por dia, sete dias por semana, ele é executado a 20-30MB / s como um dispositivo de backup de vários computadores de escritório e um punhado de servidores.

Nas últimas duas semanas, aparentemente do nada, ele foi reinicializado a cada 16 horas. Tem estado sob esse tipo de carga de trabalho há cerca de 3 anos, com apenas intervalos para atualizar a capacidade da unidade a cada 18 meses.

Existe algum lugar onde eu possa ir no console (ou via SSH) para ver o motivo pelo qual ele está sendo reinicializado?

    
por Mark Henderson 03.10.2014 / 07:52

5 respostas

0

Eu não consegui encontrar nada nos registros conforme a resposta de Wesley. Como resultado, fui ao local e troquei o chassi da QNAP por um chassi sobressalente que eu tinha e coloquei as unidades antigas no novo chassi.

Parece que está estável há mais de 2 dias, ainda sob o mesmo tipo de carga. Eu suspeito que o hardware falhou devido a um problema de superaquecimento, já que estava em um local razoavelmente quente por um tempo muito longo.

    
por 07.10.2014 / 22:58
2

Conecte-se ao seu QNAP com um terminal e procure em /mnt/HDA_ROOT/.logs . Especificamente, kmsg . Você deve ver muita informação profunda para sua leitura, interpretação e edificação final.

Outra opção é ir para a interface do usuário da Web > > Selecione Administração do sistema > > Registros do sistema > > guias na parte superior dão acesso à interface do usuário a vários arquivos.

Quanto ao que procurar, geralmente é uma porcaria do que parece ruim, e o que o Google diz é pior.

    
por 03.10.2014 / 08:04
2

se você habilitar o login do ssh então

ssh admin@<qnap_ip_addr_here>
password: admin

veja em / var / log

grep ERR *log

olhe para hal_lib.log e hal_lib.log.bak especificamente

procure por coisas como esta. Eu não acho que meu HDD foi 60C e estou desconfiado sobre se, por vezes, HDD temp é lido incorretamente. É possível que eles estejam definindo limites e não as leituras reais. Não tenho certeza.

hal_lib.log:Get_Temp_Threshold() called, SYS_ERROR_TEMP=70
hal_lib.log:Get_Temp_Threshold() called, HDD_ERROR_TEMP=60
hal_lib.log:Get_Temp_Threshold() called, CPU_ERROR_TEMP=85
hal_lib.log:Get_Temp_Threshold() called, CPU_ERROR_TEMP=85

Também estou curioso para saber se outras pessoas veem isso:

manaRequest.cgi:Tue Oct 21 16:45:48 2014
PD_Is_Exist: can't retrieve port_id value!
hal_daemon:Tue Oct 21 16:45:59 2014
root_get_fan_speed(978): NOT implement.
se_sys_get_SAS_HBA_info(3606):System Error.
disk_manage.cgi:Tue Oct 21 16:46:03 2014

você pode querer ir dentro do QNAP qui (hardware) e desabilitar a configuração inteligente da velocidade do ventilador e mudar para a velocidade manual (média sempre?)

quando diz "root_get_fan_speed (979): NÃO implementa." Eu sou suspeito. Já a velocidade do ventilador parece correta no gui. ~ 9k quando escolho médio, e > 10k quando se escolhe alta velocidade

    
por 22.10.2014 / 01:46
0

Gostaria de saber se houve alguma falha inesperada que causou uma reinicialização, então a QNAP estava decidindo que precisaria ressincronizar as unidades. E a operação normal é permitida durante a ressincronização. Mas eu tive problemas com a atividade durante a ressincronização. Se você tem uma "carga constante" ... e ela é reiniciada a cada 16 horas, eu me pergunto se foi a interação da carga com a ressincronização.

Eu tive um problema semelhante e não consegui sair do loop de reinicialização até que parei meus trabalhos de backup e deixei a ressincronização completa (você pode encontrar o status de ressincronização no local apropriado no gui (no gerenciador de armazenamento eu acho Além disso, o log informa quando um resync é iniciado. Não tem certeza se ele registra quando é feito. O gui definitivamente vai mostrar enquanto está indo (eu acho que também é uma tarefa / trabalho no topo da página principal).

Resumo de

: verifique se ele está sendo ressincronizado. Em caso afirmativo, pare a atividade externa até que a ressincronização seja concluída.

Você também pode definir a configuração do smartfan como alta velocidade manual para obter melhor resfriamento.

    
por 08.04.2015 / 22:21
0

Você também pode verificar se a reconstrução está ocupada e quanto tempo levará em minutos, por ssh no NAS e executará:

# cat /etc/mdstat

Você verá a reconstrução do RAID, incluindo o tempo restante.

    
por 25.03.2016 / 14:29

Tags