Eu tenho um servidor doméstico com um Q6600 Quad Core e 8 GB de RAM rodando com VMWare ESXi 3.5 por cerca de 8 meses agora. Tenho 2 datastores, com 1TB (SATA HDs) cada um, um com 150GB grátis e outro com 240GB grátis. Eu tenho 9 VMs rodando 24x7 nele. Tudo estava indo bem até ontem.
Fora do blues, parei de receber respostas das VMs no ESXi. No início, eu poderia conectar usando o cliente de infra-estrutura, mas, quando se eu tentasse obter informações de qualquer VM, eu iria receber uma mensagem que a VM não pôde ser alcançada. Olhando para as informações do Host, ele me mostrava informações de rede, cpu, memória, mas quando eu tentava acessar o armazenamento de dados, ele normalmente deixava de responder. Eu só consegui abrir o datastore localizado onde o ESXi é instalado uma vez e todas as VMs estavam lá. Agora, não consigo mais me conectar a ele e realmente não sei o que fazer.
Atualizar Fiz várias reinicializações no host, e o problema se repete. Eu me conecto através do cliente de infra-estrutura mas, após alguns segundos, ele não responde. Depois de um tempo, agora não consigo me conectar mais com o cliente End Update
Qual é o melhor curso de ação para diagnosticar o problema? Eu posso acessar a tela do ESXi sem problemas, mas não sei o que fazer. Eu estava pensando em reinstalá-lo, talvez com a versão 4.0, mas não tenho certeza se devo fazer isso. Onde (e como) posso acessar qualquer coisa que possa me ajudar a descobrir o que está errado?
Tks
Nova atualização Eu reconfigurei a configuração de volta ao padrão e consegui me conectar com o VI Client. Eu recoloquei uma das minhas VMs e comecei a inicializá-la, mas tive problemas novamente; a VM tentou inicializar e acabou travando, e o cliente VI parou de responder e não consegui me conectar a ela novamente. Seguindo o conselho do @pehrs, entrei no modo não suportado e verifiquei a mensagem / var / log / e encontrei um monte de erros de leitura. Abaixo está uma amostra:
Aug 31 02:59:36 vmkernel: 0: 00: 28: 41.882 cpu0: 2179) StorageMonitor: 196: vmhba33: 0: 0: 0 status = 2/0 0xb 0x0 0x0
Aug 31 02:59:37 vmkernel: 0: 00: 28: 42: 357 cpu0: 5279) < 3 > ata4: transageld ATA stat / err 0x71 / 04 para SCSI SK / ASC / ASCQ 0xb / 00/00
31 de ago de 02:59:37 vmkernel: < 4 > ata4: status = 0x71 {DriveReady DeviceFault SeekComplete Erro 0: 00: 28: 42.357 cpu0: 5279)}
última mensagem repetida 1 vezes
Eu também tenho alguns DriveStatusError em algumas linhas do mesmo arquivo. Agora, observando o /var/log/vmware/hostd-0.log, estou recebendo alguns erros depois de abrir com êxito os arquivos vmdk da primeira VM que eu anexei novamente:
[2010-08-31 02: 44: 15: 199 Aviso 'PropertyCollector' 213004] Falha de GetPropertyProvider para haTask-ha-folder-vm-vim.Folder.registerVm-45
[2010-08-31 02: 45: 05: 693 Aviso 'PropertyCollector' 98311] Falha de GetPropertyProvider para haTask-16-vim.VirtualMachine.powerOn-49
Eu recebo vários outros erros de GetPropertyProvider depois disso, então alguns tempos limite ... Parece claro que eu tenho um problema de HD. O que posso fazer para salvar minhas VMs? Posso fazer uma verificação nos HDs? Se sim, como?
Obrigado!
Fim da atualização