host ESXi perdendo conexão ao vCenter

2

Estou tendo um problema muito estranho com um único host ESXI.

Eu tenho 2 hosts idênticos, Core i3, 6 nics, 16g ram. 4 dos nics são usados para Management, vmotion, vm network, todos em diferentes vlans. Todos eles vão para um switch de porta HP Procurve 24 port em um tronco estático. Os outros dois nics são iSCSI.

Existem 2 VSSs, um com 4nics e o segundo apenas com 2 e iSCSI.

A configuração em ambos os hosts é idêntica, o hardware é idêntico. Ambos os hosts estão rodando a cerca de 30% de utilização tanto da CPU como da memória. Eles estão executando o ESXI v. 5.1.

O que está acontecendo é que todo o host 2 súbito sairá do vCenter. (O vCenter está hospedado em uma máquina física). Nenhum erro, apenas perde a conexão.

Se eu tentar fazer o ping do host do vCenter, não posso. Se eu tentar pingar a partir da minha estação de trabalho, eu posso na maioria das vezes e posso SSH para ele. Se eu "testar a rede de gerenciamento" do DCUI, ele poderá fazer ping no gateway e nos servidores dns. Se eu reiniciar a rede de gerenciamento, ainda não consigo acessar o vCenter.

Se eu fizer uma reinicialização do services.sh tudo sem nenhum erro, mas não ajudar, o host ainda não poderá se registrar no vCenter nem receber ping do vCenter.

A única coisa que até agora resolve isso é reiniciar completamente o host. Eu fiz uma exportação de log, mas eu não tenho certeza do que procurar neste momento. Quais logs devo estar olhando? A única outra informação que posso acrescentar é que isso parece acontecer na mesma hora do dia, no início da manhã. Não há nada em execução neste momento, não há trabalhos de backup, etc.

    
por TheEditor 30.01.2014 / 14:20

1 resposta

2

Sempre que vejo esses problemas no hardware do whitebox, verifico os drivers (e firmware) dos componentes críticos envolvidos (NIC, armazenamento) e sugiro atualizar para a versão mais recente da distribuição do ESXi usando o VMware Patch Portal ou o Update Manager.

Laboratório ou nenhum laboratório, você está executando uma versão antiga: ESXi 1065491 versus o atual ESXi 1483097 .

Siga em frente e execute as atualizações como um primeiro passo: Os patches cumulativos do VMware ESXi 5 são cumulativos

Depois disso, eu procurava os logs dos hosts reais para ver o que está acontecendo perto do tempo de desconexão do vCenter. Verifique /var/log/hostd.log e /var/log/vmkernel.log .

Se tiver certeza de que não há nenhum problema de firewall, DNS ou outros problemas de rede, essa é a sua melhor opção para entender o que está acontecendo.

Se tudo mais falhar, este é ESXi e você terá armazenamento compartilhado. O tempo gasto na resolução de problemas de uma compilação como essa nem sempre é útil, especialmente se o outro host estiver executando bem. Copie suas configurações via PowerCLI , reconstrua e < a href="https://serverfault.com/a/550282/13325"> restaure o host.

    
por 30.01.2014 / 16:05