O Xeon Server congela aleatoriamente por alguns segundos sem um padrão ou erros

3

Eu tenho um problema bem estranho.

Eu sou um administrador de sistemas e gerencio dezenas de servidores Xeon, mas um deles (com uma baixa carga de usuários) está se comportando de maneira muito estranha.

Especificações do servidor:

CPU: Intel Xeon E3 1230 V2
MB: Gigabyte Z77N-WIFI, Bios Version F2 (08/13)
RAM: 16GB DDR3 Dualchannel NON-ECC (2x Kingston 99U5471-037.A00LF)
OS: Windows Server 2012 R2 Standard

Este servidor hospeda duas máquinas Hyper-V. Um é Linux Debian e o outro Windows 7

O problema: O servidor congela aleatoriamente a cada hora ou mais por 5-40 segundos. Por congelamento, quero dizer que não mais IO vem do servidor, as conexões RDP são redefinidas, as conexões SSH remotas das VMs são redefinidas e todas as conexões ativas são expiradas.

Quando o servidor está de volta on-line, posso ver no Gerenciador de Tarefas que a CPU caiu para 0% quando congelada.

O registro de eventos nunca possui entradas dos congelamentos e, posteriormente, nenhuma mensagem de erro de qualquer serviço ou sistema é registrada.

O que posso dizer sobre os congelamentos:

  • Não há padrão nos congelamentos
  • Os congelamentos ocorrem igualmente aleatórios com alta ou baixa utilização da CPU
  • Eles ocorrem com baixa e alta utilização de RAM
  • Não é um problema da NIC, pois a CPU cai para zero e isso acontece mesmo quando não está conectado
  • Os HDDs estão em boa forma

Eu fiz um script de ping que registra os tempos de resposta (500 significa tempo limite) e deixe que ele seja executado no último dia.

Alguém já encontrou algo assim?

    
por Christian 18.07.2014 / 16:26

1 resposta

1

Os problemas pararam. Não sei qual foi a solução final, mas foi uma dessas coisas:

  • Eu comprei uma nova fonte de alimentação desde que ela foi underscaled (200W agora é 400W)
  • Eu re-instalei todos os drivers do chipset Intel
  • Eu re-instalei os drivers do nic
  • eu dobrei a RAM

E agora eu não tenho um único atraso por mais de um mês.

    
por 21.09.2014 / 12:43