Problema que afeta o desempenho geral no Server 2012 R2

3

Em 2016, implantamos uma solução para um de nossos clientes que era uma solução RDS do Windows 2012 R2 com 2 servidores host de sessão, um servidor Web, alguns servidores de arquivos, um servidor SQL e um servidor Exchange.

Tivemos vários problemas de desempenho desde que foi lançado. a maioria das questões parece estar relacionada à rede / comunicação, mas é muito difícil identificar o problema exato.

Quando criamos a solução, implantamos uma única máquina do 2012 R2 e a instalamos em um modelo; Agora acreditamos que houve um problema subjacente com essa instalação.

O sistema interno do cliente é um site ASP com um banco de dados SQL. Eles estão constantemente relatando problemas de velocidade com até as mais simples consultas no banco de dados. Às vezes, salvar anotações em um trabalho na verdade acabará e falhará, quando isso não deve ser mais do que um 'INSERT INTO blah blah'.

Além disso, houve problemas ao copiar arquivos de um servidor para outro. Inicialmente, conseguimos reproduzir um problema no qual todo o servidor congelava por um período (às vezes vários minutos) quando um arquivo era copiado de um compartilhamento no Servidor 1 para um compartilhamento no Servidor 2. Ajustávamos e atualizávamos as coisas e resolvíamos isso, mas os usuários ainda relataram que não copiariam os arquivos a uma velocidade decente de forma intermitente.

Também tivemos problemas com o Outlook nos servidores host da sessão relatando erros aleatórios na rede e travamentos. Às vezes, quando você tenta reabrir o Outlook, ele informa que os problemas de rede estão impedindo a troca de uma conexão. segundos depois, ele abrirá bem. Isso novamente é completamente intermitente.

Solucionamos problemas em praticamente tudo que podemos pensar. Para citar apenas alguns ...

  • Nós reinstalamos todos os hypervisors.
  • Achatamos a SAN e reconstruiu.
  • Reconstruímos a rede (fibra de 10 Gb em todo o ciclo).
  • O fornecedor de hardware (Dell) examinou a SAN e os switches para erros ... nenhum foi encontrado.
  • Nuclearamos e reconstruímos a pilha de rede em cada máquina virtual.
  • Removemos o agrupamento de NICs.
  • Instalamos todas as atualizações disponíveis.

Cheguei ao ponto de realmente reimplementar alguns servidores do zero, dessa vez como o Windows Server 2016 para ver se eu pudesse superar os problemas. Um pouco irritante, depois de fazer isso, os problemas correspondentes foram imediatamente resolvidos.

Por exemplo, quando eu reconstruo os servidores de arquivos, a cópia de arquivos entre eles é praticamente instantânea - não houve relatos de atrasos ou problemas. Além disso, quando eu reconstruo o servidor Web e o SQL Server, o problema com o SQL aguardando para processar tarefas e, às vezes, não salvando as notas, etc., foi imediatamente resolvido.

Eu realmente não quero percorrer a rota de reconstruir os servidores de troca ou os servidores de host de sessão e já provei que uma atualização in-loco não funcionará (tentei em um dos servidores de arquivos) , então espero poder identificar a causa raiz do problema e resolvê-lo.

Estou ciente de que não forneci muitas informações para apontar com confiança para um culpado, mas alguém já se deparou com algo assim antes e descobriu a causa ou alguém tem uma ideia do que pode ser culpado?

Estou planejando levantar um caso de suporte com a Microsoft se não conseguir chegar ao fim em breve ... Eu pagarei com alegria pelo suporte, mas mesmo isso vai exigir que eu alcance o problema com precisão para garantir que vai para a equipe correta, e é muito difícil de escopo ... diabos, eu estou lutando para escolher tags para este post.

Qualquer ajuda ou pensamentos ou sugestões são apreciados.

Obrigado antecipadamente.

    
por John 08.01.2018 / 16:01

0 respostas