Os nós do Oracle VM 2.2 são reinicializados sem nenhum motivo óbvio

2

Eu tenho um ambiente Oracle VM simples de quatro nós. Um servidor de gerenciamento em execução no vmware, um servidor nfs para armazenamento compartilhado e dois servidores Oracle VM executando o hipervisor real.

Por algum motivo, o nó que está executando o serviço mestre do pool será reiniciado repentinamente sem nenhum motivo óbvio. Tenho quase certeza de que é um problema de software, possivelmente algum tipo de cão de guarda do cluster. Só para ficar claro, é o servidor / hipervisor vm que reinicia, não as máquinas convidadas.

Alguém viu problemas semelhantes ou tem alguma sugestão sobre onde devo começar a procurar a causa raiz?

Eu não vejo nada de suspeito em / var / log / ovs * / logs, em qualquer outro lugar que eu deva olhar?

A documentação da Oracle deixa um pouco a desejar.

    
por Roy 12.11.2009 / 17:54

3 respostas

1

Acontece que os nós não estavam se comunicando corretamente, devido ao nome do host do nó que está sendo listado no endereço de loopback em / etc / hosts. Os serviços de cluster forçariam silenciosamente uma reinicialização para proteger o armazenamento compartilhado.

    
por 21.11.2009 / 13:51
1

Não tenho certeza se você tem os gráficos interessantes que vêm com o Gerenciamento de VMs ou não. Se você fizer isso, eles fornecem uma quantidade razoável de informações sobre o que a memória, a CPU e os discos estão fazendo. Talvez possa haver alguma correlação? A partir daí, você pode começar a ver o topo e o ps para ver exatamente o que está sendo executado e em uso quando o servidor for devolvido.

Você também pode definir os servidores no modo de depuração? Eles apoiam isso?

Espero que isso ajude você a começar pelo menos.

    
por 12.11.2009 / 19:11
0

Você está usando o ocfs2? se assim for, aumentar o timeout do ocfs2 em /etc/sysconfig/o2cb.conf

    
por 12.08.2010 / 19:17