Lentidão extrema inexplicável no Dell PowerEdge R320, corrigido apenas pela reinicialização a frio

3

Neste site do cliente, há dois novos servidores Dell PowerEdge R320 com a seguinte configuração:

  • Uma única CPU de 6 núcleos
  • 16 GB de RAM
  • discos SATA de 2 x 500 GB em uma matriz RAID 1

O.S. é o Windows Server 2012 R2, usado como controlador de domínio; todos os firmwares e drivers estão atualizados, e o Windows está totalmente atualizado; a carga do sistema é geralmente muito baixa.

De repente, um dos servidores desacelerou para um rastreamento. E por "crawl", quero dizer "não foi capaz de pintar uma janela em um tempo decente". Fazer qualquer coisa, mesmo clicando com o botão direito do mouse e mostrando o menu contextual, mesmo movendo o cursor , era uma dor excruciante.

Não houve carga incomum no servidor: o uso da CPU foi de 1 a 3%, o uso de RAM ficou abaixo de 4 GB, nenhum disco ou picos de rede, nada.

Também não houve erros em qualquer log de eventos do Windows (quando finalmente conseguimos abri-lo), e a lentidão não cessou quando o cabo de rede foi desconectado.

A reinicialização do Windows também era inútil: depois de um tempo de inicialização muito longo, o sistema permanecia muito lento como antes.

Por último, mas não menos importante, não houve mensagens de erro no visor do painel frontal do sistema ou na tela durante o POST.

Como último recurso, decidimos tentar uma inicialização a frio e, na verdade, desconectamos os cabos de alimentação antes de reiniciar o servidor. Isso resolveu o problema: o sistema inicializou normalmente e retomou o desempenho total.

No entanto, a questão permanece: WTF aconteceu aqui?!?

E, mais importante: como podemos garantir que isso não aconteça novamente?

    
por Massimo 31.10.2014 / 19:10

4 respostas

1

Teve um problema idêntico, depois de examinar os logs da DSET enquanto o problema estava presente e depois da correção da inicialização a frio, o suporte da Dell alegou oscilação de energia, servidor acionado pela APC 1500kVA SmartUPS no momento.

O suporte da Dell recomendou inicialização a frio para redefinir os sensores (desligue a energia, segure o botão liga / desliga por mais de 3 segundos).

O suporte também sugeriu o patching do iDrac para o último disponível 1.66.65 através do Lifecycle (requer reinicializações) ou do sistema Windows (não requer reinicialização).

Isso aconteceu há algumas semanas durante a primeira semana de janeiro de 2015 e o problema não retornou.

ESM_Firmware_3F4WV_WN64_1.66.65_A00.EXE

Dell PowerEdge R320 CPU de 6 núcleos 24 GB de RAM 2 x 1000 GB NLSAS discos RAID 1

    
por 26.01.2015 / 06:08
0

Eu tenho 2 Win2K12-R2 T320 com o mesmo hardware, firmware e drivers. Ontem, um deles ficou dolorosamente lento - nenhuma atualização do Windows foi instalada em semanas. Depois de executar um DSET sem erros de hardware:

Recomendamos que a tecnologia da Dell entre no BIOS no T320, entre nas Configurações do perfil do sistema e altere 'Desempenho por Watt' para 'Desempenho'

Rebooted e o servidor está funcionando rapidamente e o desempenho é melhor do que em meses.

    
por 29.01.2016 / 08:48
0

Gostaria de começar atualizando todas as versões de firmware para as mais recentes disponíveis, incluindo o BIOS, iDRAC / Lifecycle Controller. É mais provável que isso seja um problema com o uso de energia & configurações de desempenho no BIOS embora. Confira o Performance and Power Tuning doc para servidores da 12ª geração da Dell para obter detalhes.

    
por 31.01.2016 / 09:28
0

Isso aconteceu com o nosso T320. Foi um bug no bios. A Dell lançou um BIOS atualizado e o problema foi corrigido. Uma solução alternativa é definir o BIOS da seguinte maneira:   No PowerEdge Bios, altere o perfil do sistema para Performance Optimized. Isso desativará os estados C e C1E. Instruções: link

    
por 24.09.2017 / 02:27