Por que a unidade Hitachi HDS5C3020 não particionada começa a consumir 50% a mais de energia 15 minutos após a inicialização?

18

Em um sistema Debian 6.0.6, existem 74 unidades de 2TB Toshiba DT01ABA200. Essas unidades são identificadas como unidades Hitachi HDS5C3020BLE630 executando a revisão de firmware MZ4OAAB0. 64 Unidades conectadas via placas expansoras HP SAS a um controlador SAS LSI 2008, outras 5 unidades são conectadas diretamente à placa-mãe, 4 unidades são conectadas a um controlador PCI baseado em Sil e o último 1 é alimentado e não possui nenhum cabo de dados conectado. Os cartões LSI e Sil do seu controlador de BIOS estão ambos desabilitados e os módulos mpt2sas e sata_sil são removidos do kernel Linux GNU / Linux do debian 2.6.32-5-amd64 # 1 SMP Sun Sep 23 10:07:46 UTC 2012 x86_64. O módulo mpt2sas é carregado após a inicialização usando um comando modprobe em /etc/rc.local. Essas 74 unidades não são particionadas, nem formatadas e nem montadas.

O sistema consome:

  • com 0 unidades : 70,6 - 70,9 Watt (também 15 minutos após a inicialização);
  • com 74 unidades : 330 - 360 Watt, logo após a inicialização (é equivalente a 3,5 - 3,9W por unidade em estado inativo);
  • com 74 unidades : 420 - 466 Watt, cada vez no 15º minuto de tempo de atividade (é equivalente a 4,7 - 5,3W por unidade em estado ocioso). / li>

A especificação do inversor lista 4,7W como leitura / gravação e 3,3W como consumo de energia ociosa.

O aumento do consumo de energia é mais provável na linha de 5V, porque após cerca de 1 minuto uma "proteção contra sobrecarga de corrente" (OCP) da fonte de alimentação (PSU) desliga a energia. O PSU usado é um modelo de trilho único com um OCP de > 122A na linha de 12V e > 55A na linha 5V.

Regressão:

  • Não importa se a unidade com valor de APM está definida como desativada ou 1 (economia máxima de energia).
  • O sistema operacional não registra nenhuma atividade de leitura / gravação em /proc/diskstats . Os valores lá são idênticos (28 de leitura, 0 operações de gravação), imediatamente após a operação do modprobe.
  • Não é possível testar o que acontece quando a inicialização na placa principal é BIOS - para excluir qualquer intervenção do sistema operacional - porque a placa-mãe Super Micro X8SI6-F executando o firmware 06/27/12 tem um bug que lê incorretamente um sensor de CPU de +74.0 C temperatura como "Alta" no modo BIOS, e desliga a energia após 1 minuto.

O que pode estar causando a unidade de atividade de leitura / gravação em todas as unidades no 15º minuto após a inicialização e como evitar que isso aconteça?

    
por Pro Backup 16.12.2012 / 15:14

1 resposta

20

Soa muito como as unidades estão fazendo a depuração SMART (teste offline automático).

smartctl -a /dev/hdx

deve confirmar a configuração com:

Auto Offline Data Collection: Enabled.

Desativar com:

smartctl --offlineauto=off /dev/hdx

Pode ser outra coisa também ...

    
por 16.12.2012 / 18:16