Os servidores virtuais são reiniciados aleatoriamente apenas à noite - ID do Evento 41

1

Eu tenho dois servidores virtuais vinculados executando o Windows Server 2012:

  1. Um servidor de banco de dados com o Microsoft SQL Server Express
  2. Um servidor de aplicativos que executa o Tomcat e um aplicativo relativamente leve.

Ambos os servidores têm 4 GB.

Ambos misteriosamente reiniciam com o ID 41, sem criar um arquivo MiniDump. As reinicializações ocorrem aproximadamente uma vez a cada duas semanas e ocorrem apenas em horários aleatórios durante a noite. É incomum que nossos usuários usem o aplicativo à noite, e a única coisa fixa que acontece à noite é o Backup do banco de dados às 5h (e a maioria das reinicializações ocorre antes)

A empresa de nuvem abriu uma investigação e não encontrou nada de errado. Eles atualizaram o VMWare. Sua única sugestão é aumentar os recursos dos servidores.

Eles também afirmam que o problema não pode ser o hardware, em primeiro lugar porque é um sistema baseado em nuvem, e em segundo lugar porque nenhum outro cliente está reclamando.

Em o servidor da Máquina Virtual reinicia misteriosamente é sugerida uma sugestão de que a instalação esteja corrompida . No entanto, gostaria de sugerir que isso pode não ser uma razão no nosso caso. (1) para ambos os servidores terem o mesmo problema seria um pouco coincidente - a menos que ambos tenham sido instalados erroneamente (2), isso não explica porque o reinício acontece à noite.

Alguma ideia?

UPDATE

  1. Um servidor não está conectado à Internet, portanto, os problemas de DDOS não são relevantes.
  2. As falhas ocorrem em tempos completamente aleatórios, mas sempre à noite

  3. Eu postei um exemplo de registro de eventos do sistema no link - nada de interessante aconteceu antes das 2h. O acidente aconteceu por volta das 2:17 da manhã.

  4. Não sei de nenhuma tarefa agendada específica que aconteça à noite.

  5. Mover as VMs por aí não é uma opção no momento, embora aqui exista um pouco mais de informações: elas estão sendo executadas no VMWARE e são servidores virtuais executados em VLANs separadas.

  6. Temos um servidor de teste virtual que executa ambos o servidor de aplicativos e o servidor de banco de dados (e tem uma configuração muito semelhante) que parece não ter problemas.

por gordon613 04.05.2017 / 12:09

2 respostas

1

Eu começaria primeiro com a criação de uma tarefa de monitor de desempenho com base no uso de CPU / RAM e HD. Isso pode ajudar a excluir vazamentos de memória, picos de CPU (talvez lixeiras de log bi-semanais ou semelhantes) ou erros de gravação de disco.

Além disso, você pode tentar verificar o BlueScreenView para ver se é BSODing.

    
por 11.05.2017 / 15:27
1

Um sistema baseado em nuvem é apenas um sistema que é executado no hardware de outra pessoa. Ainda pode haver um problema baseado em hardware no host que está executando a VM.

Se, por exemplo, o host tiver um único bloco defeituoso de memória, esses dois hosts poderão atingir esse bloco constantemente. Especialmente porque um dos servidores é um banco de dados.

Você tem outros vms no mesmo host? Se não, você pode mover um por lá temporariamente e mover esses dois para um host diferente? Isso pode ajudar você a isolar o problema. O host também deve criar logs, se possível. Verifique com a empresa se eles estão monitorando o host e criando logs.

    
por 11.05.2017 / 19:39