Eu tenho duas caixas SQL independentes em um cluster ESX de 2 hosts. No momento, eles estão sendo executados no mesmo host.
Fazemos backup noturno usando o Veeam. Um desses servidores atinge 90-100% da CPU durante a duração do backup. O outro não.
Eu construí as duas caixas, admitidamente a algum tempo de distância, mas tenho certeza que as configuraria de forma idêntica. Os discos base estão sendo executados no mesmo array, o LUN separado é provisionado como um armazenamento de dados vmfs SQL dedicado e ambos estão fazendo o backup para o mesmo destino. O proxy Veeam é o mesmo para cada um. O Veeam está configurado para o Direct SAN (e parece que está funcionando).
O servidor que não tem tem um desempenho ruim é a caixa que mais trabalha. Durante o dia, sem nada de especial, está em constante 30% de CPU. O servidor com o qual estamos tendo problemas normalmente ficará com uma% de uso da CPU em horários equivalentes.
Estou com um pouco de perda de como progredir isso, eu realmente não entendo o que primeiro precisa investigar neste momento. Eu descartei (em minha mente) armazenamento, hardware, rede e não consigo ver o que no nível do sistema operacional seria a causa dos problemas que vejo.
Suponho que haja alguma interação entre a caixa SQL problemática e o ESXi que não seja feliz, mas não sei por onde começar.
Alguma opinião?
Tags performance sql vmware-esxi