Diagnosticar porque o servidor caiu

1

Eu tenho um par de aplicativos da Web Asp.Net executando um VPS do Windows Server 2008 R2. Nós temos usado este VPS por anos. Desde os últimos meses, temos nossos aplicativos desativados por 30 a 45 minutos. Isso não acontece periodicamente e isso não acontece na mesma hora do dia. Isso deve ter acontecido talvez 4 ou 5 vezes nos últimos 2 meses. Nossas análises não relatam um grande número de usuários simultaneamente on-line. Temos mais usuários on-line e não tivemos problemas.

Durante o tempo de inatividade, não podemos RDP no VPS. O novo monitoramento de relíquias mostra atividade zero em qualquer frente. Depois que o VPS estiver on-line novamente, os aplicativos funcionarão normalmente. Mesmo depois que o VPS estiver on-line novamente, nwe relic não mostrará nenhuma nova entrada para esse período de tempo. O visualizador de eventos também não exibe entradas durante o período de inatividade. Temos as entradas usuais nos registros Sistema / Segurança / Aplicativo, quase uma por minuto, até a hora em que o tempo de inatividade começou. E a próxima entrada começa depois que o tempo de inatividade acabou.

Parece quase como se, durante esse período, nosso VPS fosse colocado para dormir. Eu verifiquei o visualizador de eventos para eventos com ids 6005,6008,6009,6013,1072,1074,1076. Eu li em várias postagens da internet que esses IDs de eventos podem ajudar a identificar desligamentos / reinicializações planejados / inesperados. Não encontrei nenhum para esse intervalo de tempo.

O que mais posso fazer para identificar por que isso está acontecendo e impedir que isso aconteça?

EDITAR

Esta instância do tempo de inatividade deveu-se ao host reinicializar o servidor físico. Devido às interrupções anteriores, o anfitrião alega não ter sido envolvido. Vamos ver. No momento, estou marcando o post do @ Greg como a resposta aceita, já que isso era algo que eu não considerava fazer até agora.

    
por Amith George 11.09.2013 / 16:53

2 respostas

2

O que mais você pode fazer? Ative o monitoramento / pulsação do ASP.Net Heath em intervalos de um minuto. Se não houver um heartbeat, provavelmente algo externo ao Windows / IIS / ASP.Net.

Parece mais provável que o seu provedor de serviços tenha causado a interrupção do que um defeito do sistema operacional, o que provavelmente teria impacto zero se fosse usado vários servidores em vários hosts / redes.

Se você não tiver nenhum contrato de métricas, medidas ou disponibilidade, não terá muita sorte tentando fazer uma engenharia reversa de uma resposta obtendo o sistema operacional do cliente para resolver problemas dos hosts ou da rede do Provedor VPS.

Infelizmente, os aplicativos em movimento "nuvem" não podem consertar a arquitetura desestruturada ou disfuncional ou as habilidades de contratação.

    
por 11.09.2013 / 18:25
2

Entre em contato com seu provedor de vps. Pode haver falha de hardware, problema de rede ou qualquer outra coisa. A perda de conectividade remota sugere que o problema está fora do seu aplicativo e, provavelmente, fora do sistema operacional. Seu fornecedor deve ser capaz de ajudá-lo a diagnosticar os problemas ... Se não, acho que você ainda terá uma resposta sobre o que fazer com seus problemas de confiabilidade.

    
por 11.09.2013 / 16:58