Gerenciando ciclos de reaprendizagem de baterias em LSI e controladores RAID semelhantes

11

Como os engenheiros lidam com os ciclos de reaprendizagem da bateria do controlador RAID?

Como observado em: O que é uma "reaprendizagem de bateria" em um LSI MegaRaid? , o ciclo de reaprendizado descarrega a bateria do controlador RAID (BBWC ou BBU), removendo assim a aceleração do cache de gravação. A vida útil da bateria é verificada e, uma vez carregada, o cache de gravação é reativado. Isso tem um impacto óbvio no desempenho de E / S do servidor durante o ciclo de reaprendizado. Acho que isso ocorre mensalmente.

A degradação do desempenho foi observada, especialmente em sistemas de banco de dados:

Banco de dados lento? Verifique a bateria RAID!

Saiba mais sobre sua bateria

Minha experiência está nos servidores HP ProLiant, cujos controladores Smart Array não passe por este exercício ( ou pelo menos tenha monitoramento de vida da bateria mais proativo ). Esta parece ser uma característica terrível ( máximo inconveniente, pouco ganho ), mas eu estou em um ambiente com muitos controladores LSI (em Supermicro hardware) e gostaria de ver se uma política geral pode ser aplicada aos sistemas relevantes.

  • Qual é o agendamento padrão do ciclo de reaprendizado em um controlador LSI?
  • Esses ciclos de reaprendizagem são úteis?
  • Esse recurso deve ser desativado?
  • Se você optar por deixar esse recurso ativado em seu ambiente, como você lida com o agendamento? Você agenda isso manualmente ou permite que o controlador defina sua própria programação?
  • Os controladores Dell Perc são afetados da mesma maneira? ( LSI é o OEM )
por ewwhite 10.08.2013 / 22:03

1 resposta

12
Recentemente li um artigo de um dos engenheiros da Godaddy sobre esse mesmo tópico: deal learning / "> Aprender a lidar com a aprendizagem

Em seu hardware (Dell PERC cards), o ciclo de aprendizado da bateria acontece a cada 90 dias, mas não é possível saber exatamente quando isso acontecerá, ou seja, durante as horas de pico ou fora do horário de pico.

Eles falaram sobre soluções diferentes:

  • Outright desativa o aprendizado de bateria. O problema com essa opção é que você não saberá o status da sua bateria, quanto tempo e quanto ela pode ser cobrada, portanto, no caso de interrupção você pode arriscar a perda de dados.

  • Use hardware diferente. Alguns controladores têm 2 baterias e alternam entre eles durante esses ciclos de aprendizado. Além disso, existem controladores RAID (como o Dell H710) que não precisam de baterias, mas usam NVRAM não volátil para armazenar dados não confirmados.

  • Force write-back (caching), independentemente do status de suas baterias. Como a primeira solução, você está arriscando a perda de dados.

Em última análise, eles configuram crons para horários fora de pico que monitoram o próximo ciclo de aprendizado e, se ocorrerem nas próximas 24 horas, eles o obrigam a acontecer imediatamente. Dessa forma, eles mantêm o benefício de exercitar as baterias sem executá-las nos horários de pico.

    
por 11.08.2013 / 09:19