VM do Windows XP no VMWare ESXi 4.1 “pausando” / bloqueado ocasionalmente

1

Temos um problema com as VMs do Windows XP SP3 no VMWare ESXi 4.1.0 (a versão gratuita): elas às vezes parecem "pausar" por vários minutos. Isso acontece raramente (talvez uma vez por semana, por VM, nem sempre percebemos), mas ainda é um problema para nós. Isso acontece para três VMs diferentes, mas semelhantes, em três hosts diferentes com hardware bem diferente.

Tenho a sensação de que a "pausa" não é realmente o bloqueio do CPU, mas provavelmente os discos rígidos, mas não 100% de certeza. Os servidores têm um disco IDE (C :) e um SCSI (D :) e pode ser um dos dois. Eu vi tarefas agendadas não iniciando por até 9 minutos e, em seguida, executando normalmente novamente com velocidade normal. Este não é um problema de carga, os hosts VMWare têm carga média maior e as VMs em questão já têm recursos de CPU reservados além de altas prioridades para CPU e disco. Eu tive a chance de ver isso acontecer ao vivo e a carga do host VMWare estava abaixo da média naquela época.

As caixas do Windows executam principalmente MySQL, Tomcat, coisas do Cygwin, aplicativos Java + R, ferramentas VMWare, servidor Elusiva Terminal Server, servidor FileZilla FTPS, cliente Nagios. Não tenho certeza se o problema pode ser causado por qualquer um desses softwares (por exemplo, Elusiva).

Tentando depurar isso, não havia nada visível no log de eventos do Windows, outros logs em C: \ Windows, eventos VMWare, etc. Infelizmente, o arquivo vmware.log no host terminou com "Log throttled" para todas as três ocorrências semanas atrás . Descobrimos que encontramos dois bugs conhecidos e documentados do VMWare: as ferramentas do VMWare escrevem muito em mensagens falsas no vmware.log causando o afogamento VMWare KB , mais o VMWare nunca desvia o log (pelo menos até agora, apesar das reinicializações da VM). Agora, aplicamos a correção para o primeiro bug (configuração de erro de nível de log de ferramentas VMWare), mas até agora não houve desuso, apesar da reinicialização da VM.

Eu sei que isso não é muito para definir o problema e que também pode ser a razão pela qual eu até agora não encontrei nada relacionado na web ou no ServerFault, mas talvez alguns desses toquem com alguém? Ou, por favor, dirija-me para o que mais informações publicar. Espero que o vmware.logs acabe sendo desintegrado (não é possível reiniciar facilmente os hosts no momento, o que pode ajudar).

Muito obrigado por qualquer entrada!

    
por FelixD 03.12.2012 / 11:39

0 respostas