Nós nos deparamos com uma situação estranha em que um cluster de nó único do SQL Server 2008 trava. Como pano de fundo, estamos reconstruindo um cluster de dois nós do Windows Server 2003 / SQL Server 2005 usando o Windows 2008 e o SQL Server 2008. Aqui está a linha do tempo:
- Desbloqueou o nó passivo (servidor B) do cluster do Windows 2003 / SQL 2005. O nó ativo agora funciona como um cluster de nó único sem problemas.
- Limpou os discos do servidor B e instalou o Windows 2008 e o SQL Server 2008 como um cluster de nó único. Como não queremos que os dois clusters se comuniquem ainda, deixamos o adaptador "heartbeat" da rede privada do cluster não configurado. O cluster surge e funciona normalmente.
- Movido todos os bancos de dados para o novo cluster. O cluster continua a funcionar normalmente.
- Desligou o servidor A (cluster antigo) na preparação para a reconstrução como o segundo nó do novo cluster.
-
A instância do SQL Server no servidor B (novo cluster) é bloqueada , embora não deva ter conhecimento ou interação com o servidor A.
- Servidor reiniciado A. A instância do SQL Server no servidor B (novo cluster) começa imediatamente a funcionar novamente.
Coisas que tentamos:
- O nome do novo cluster responde a solicitações ping e NETBIOS, mesmo quando o SQL Server está suspenso.
- Confirmamos que nenhum endereço IP está atribuído ao adaptador de pulsação antigo e não está puxando um endereço IP do DHCP.
- Desativar a placa de rede do heartbeat tem o mesmo efeito.
- Nenhum erro foi gerado em nenhum log - Windows ou SQL.
- Quando o erro ocorreu pela primeira vez, ele ficou parado por um bom tempo (bem mais de 10 minutos) antes que alguém descobrisse o que estava acontecendo. Isso parece eliminar qualquer tipo de tempo limite de cluster normal em que ele teria procurado o outro nó (mesmo se um tivesse sido configurado).
O servidor B está executando o Windows 2008 SP2, totalmente corrigido, e o SQL Server 2008 SP1 CU7 (10.0.2775).