Indisponibilidade intermitente de uma instância em um cluster de failover enquanto um nó em espera está offline em um cluster de failover do SQL Server 2008

2

Eu tenho um pequeno cluster de failover que eu executo para os sites da minha empresa. Durante uma atualização de RAM do servidor em espera, nossos sites começaram a mostrar erros sobre a impossibilidade de acessar o servidor de banco de dados. Verifiquei que a instância estava realmente ativa e o servidor acessível por meio da área de trabalho remota. Eu também tentei uma conexão SQL com ele e funcionou, mas isso pode ter acontecido depois que ele se tornou disponível novamente.

Isso aconteceu de vez em quando até que pudemos reverter as alterações de hardware que estavam em andamento no servidor em espera e conseguimos recuperá-lo.

Não havia nada de interesse no log do SQL Server, mas há um log contínuo durante toda a duração do problema, portanto, não houve reinicialização do serviço do SQL Server. O visualizador de eventos é de maior interesse, pois mostra eventos relacionados à placa de rede de heartbeat, mas não sei como isso afetaria a disponibilidade do servidor, já que o nó de espera está offline. Eu apreciaria qualquer ajuda que você pudesse fornecer, não seria muito redundante se a configuração dependesse do servidor em espera. :)

Aqui estão os logs de eventos do momento do problema, incluo todos eles, pois não consigo ver o que poderia ser a causa do problema.

Registro de eventos: link

    
por EmilF 26.04.2010 / 17:17

1 resposta

1

Você tem o log do servidor da Web que não conseguiu obter uma conexão SQL? Pode haver uma pista lá.

Isso é um pouco preocupante:

"O sistema detectou que o adaptador de rede Local Area Connection * 9 estava conectado à rede e iniciou a operação normal."

"O sistema detectou que o Cluster do adaptador de rede estava conectado à rede e iniciou a operação normal."

Dentro de 30 segundos um do outro no final da interrupção.

O que é Conexão de Área Local 9? Eu estou supondo que "Cluster" é a conexão de heartbeat para o outro nó ... para que isso faria sua conexão de domínio? Em caso afirmativo, dado que não vemos uma entrada para ele cair, parece que ele foi desconectado também durante a sua manutenção ...

    
por 19.05.2010 / 14:41