Terá duas instâncias de aplicativos da web garantindo a disponibilidade de problemas de WPA?

1

Eu tenho um aplicativo web azul (plano de serviço de aplicativo S2) definido para escalonamento automático, mas com uma contagem de instâncias mín. 1. Como a maioria está inativa, a contagem real de instâncias também é 1 quase o tempo todo. >

Na semana passada, "algo" aconteceu e o site não estava mais disponível. Cada pedido foi respondido com o status http 500. Isso durou cerca de 10 horas e, de repente, o site estava disponível novamente. Eu não mudei nada um dia antes da condição de erro, nem fiz nada para fazer o site voltar novamente.

Eu iniciei um suporte para isso e um engenheiro de suporte esteve analisando isso. Segundo ele, o motivo do problema foi:

the root cause is pointing at the Windows Process Activation Service, which was unable to run the process related to your application and the platform was unable to recover it in the specified time Frame

Como não tenho como configurar o WPA, considero que isso seja um problema com a plataforma. O engenheiro de suporte confirmou.

Eu acho que isso significa que o azure deve lidar com um estado como este e fazer o que for necessário para recuperar o aplicativo novamente. Como demorou 10 horas para o serviço voltar on-line, suponho que isso aconteceu por acaso e azure não fez nada aqui. Devo postar um relatório de bug referente a este incidente? (O engenheiro de suporte não é realmente útil aqui ...)

Além disso, o engenheiro de suporte insiste que ter mais de uma instância resolveria o problema de disponibilidade, porque

instance so I can confirm that the redundancy failover option in this scenario would be for you to scale out the site to a minimum of two instances. This way, if one of the instances is unavailable, the second one would take over.

Acho que isso simplesmente não pode estar correto porque o aplicativo da web foi relatado como "saudável" pelo azure e respondeu à solicitação, embora com o status 500.

Nesse caso, o azure realmente enviaria tráfego apenas para a instância que não retornava o status 500? E também, dado que eu não sei o que causou o problema WPA em primeiro lugar - não é possível o mesmo problema também teria aparecido com a segunda instância?

    
por Thomas Woelfer 11.07.2018 / 15:33

1 resposta

0

Quando você dimensiona várias instâncias de um aplicativo da Web, elas ficam atrás de um balanceador de carga (você não verá isso, mas é isso que acontece nos bastidores). O probe balanceador de carga deve detectar os 500 erros provenientes de sua primeira instância e não direcionar nenhum tráfego para ele.

Suas instâncias de aplicativos da web estarão sendo executadas em diferentes VMs, portanto, se um problema WPA ocorrer no primeiro, ele não deverá afetar o segundo. Dito isso, existe a possibilidade de outro problema WPA ocorrer no segundo host, especialmente se algo em seu aplicativo estiver acionando esse problema.

    
por 12.07.2018 / 13:03