Como determinar a causa das interrupções de serviço em hosts virtuais VMware

1

Eu estou tentando determinar a causa das interrupções que tenho experimentado de forma irregular com vários dos meus servidores virtuais que são executados no vmware esxi4. Eu tenho 12 servidores virtuais espalhados por duas máquinas host esxi e eu só notei esse problema com 3 deles. Os servidores virtuais com problemas são um servidor ftp e dois servidores dns.

Quando ocorrem as interrupções, posso fazer login no vSphere client e usar o console dos servidores virtuais em questão, mas durante as interrupções (que duram de um minuto a quase uma hora), os servidores virtuais parecem passar por lentidão incrivelmente lenta velocidades de transferência de rede na ordem de 0-3 kilobits por segundo ou nenhuma conexão em tudo. (o data center em que eles estão tem conexão de 100MB)

O sistema operacional das máquinas é debian lenny e é atualizado regularmente.

Eu não consegui determinar a causa dessas interrupções e elas realmente estão começando a me incomodar, então qualquer ajuda na determinação da causa desses problemas seria muito apreciada.

o arquivo de log do esxi contém apenas

Feb 08 13:16:57.981: mks| SOCKET 8 (105) recv error 104: Connection reset by peer
Feb 08 13:16:57.981: mks| SOCKET 8 (105) destroying VNC backend on socket error: 1
Feb 08 13:16:57.998: mks| MKS: Base polling period is 1000000us
Feb 08 20:28:14.774: mks| MKS: Base polling period is 10000us
Feb 08 20:28:15.194: mks| VNCENCODE 9 encoding mode change: (720x400x16depth,16bpp,1440bytes/line)
Feb 08 20:28:15.228: mks| VNCENCODE 9 encoding mode change: (720x400x16depth,16bpp,1440bytes/line)

repetido várias vezes. Isso é simplesmente eu me conectando e desconectando do console?

    
por m3z 08.02.2011 / 21:46

1 resposta

1

Aqui está o que eu gostaria de verificar:

  1. Atualize o ESXi para a compilação mais recente (4.1)
  2. Atualize o VMtools nos convidados (VMs) para o mais recente.
  3. Desative tudo o que você não precisa nas VMs (daemons) - isso obviamente deve ser feito para qualquer servidor.
  4. De acordo com a recomendação da VMware, valide se você tiver atribuído 1vCPU por VM, a menos que você esteja executando aplicativos especificamente capazes de usar várias CPUs.
  5. Valide se você não compromete recursos em excesso, como memória.
  6. Copie o log do vmware da VM para o seu PC, geralmente localizado no mesmo diretório do armazenamento de dados que a própria VM e examine-a em busca de mensagens estranhas.

Suponho que você tenha validado que os hosts são compatíveis com VMware, caso contrário, o VMware não suportará você.

    
por 08.02.2011 / 22:40