Eu tenho um aplicativo web azul (plano de serviço de aplicativo S2) definido para escalonamento automático, mas com uma contagem de instâncias mín. 1. Como a maioria está inativa, a contagem real de instâncias também é 1 quase o tempo todo. >
Na semana passada, "algo" aconteceu e o site não estava mais disponível. Cada pedido foi respondido com o status http 500. Isso durou cerca de 10 horas e, de repente, o site estava disponível novamente. Eu não mudei nada um dia antes da condição de erro, nem fiz nada para fazer o site voltar novamente.
Eu iniciei um suporte para isso e um engenheiro de suporte esteve analisando isso. Segundo ele, o motivo do problema foi:
the root cause is pointing at the Windows Process Activation Service,
which was unable to run the process related to your application and
the platform was unable to recover it in the specified time Frame
Como não tenho como configurar o WPA, considero que isso seja um problema com a plataforma. O engenheiro de suporte confirmou.
Eu acho que isso significa que o azure deve lidar com um estado como este e fazer o que for necessário para recuperar o aplicativo novamente. Como demorou 10 horas para o serviço voltar on-line, suponho que isso aconteceu por acaso e azure não fez nada aqui. Devo postar um relatório de bug referente a este incidente? (O engenheiro de suporte não é realmente útil aqui ...)
Além disso, o engenheiro de suporte insiste que ter mais de uma instância resolveria o problema de disponibilidade, porque
instance so I can confirm that the redundancy failover option in this
scenario would be for you to scale out the site to a minimum of two
instances. This way, if one of the instances is unavailable, the
second one would take over.
Acho que isso simplesmente não pode estar correto porque o aplicativo da web foi relatado como "saudável" pelo azure e respondeu à solicitação, embora com o status 500.
Nesse caso, o azure realmente enviaria tráfego apenas para a instância que não retornava o status 500? E também, dado que eu não sei o que causou o problema WPA em primeiro lugar - não é possível o mesmo problema
também teria aparecido com a segunda instância?