Erro de atraso de geração de erro Phishing + nginx

1

Estamos tentando migrar um aplicativo escrito no REE do provedor de nuvem A para o provedor de nuvem B. O código do aplicativo, as especificações de VM e os sistemas operacionais são os mesmos. A diferença básica é que o provedor de nuvem A usa Xen e paravirtualização, enquanto o provedor de nuvem B usa o KVM e a virtualização completa. Ah sim e ulimit -a é semelhante nas duas configurações.

No entanto, no provedor de nuvem B, recebemos com muita frequência erros como:

Message from application: An error occurred while starting the web application: it did not write a startup response in time. Please read this article for more information about this problem

A configuração no provedor A tem carga real e nunca teve esse tipo de erro. A instalação no provedor B falha assim com um usuário em algo como 18% do tempo.

Eu li o documento , mas suas soluções parecem não se aplicar nosso caso (nós geramos diretamente e não somos espertos devido à conexão com o Postgres), ou se eles esperam que as pessoas aqui possam apontar como.

Sim, eu sei que o melhor caminho é passar do REE para cima, e isso está em andamento, mas mudar o provedor agora é mais urgente.

ATUALIZAÇÃO:

De acordo com o documento, as possíveis causas são:

  • Redirecionamento de stdout. Este não pode ser o caso da configuração A, isso não está acontecendo. Também verifiquei se o script de inicialização redireciona qualquer descritor de arquivo. Não.

  • Rescisão antecipada no bash. Desativei o Phusion da leitura de .bashrc e semelhantes para evitar isso

  • Servidor ocupado demais. O servidor é novo, não está em produção e foi testado por duas pessoas. Então não está ocupado.

  • Congelamento de inicialização do aplicativo, devido a um loop ou algo do tipo, ou solicitando algo do NFS ou S3. Os aplicativos não estão falando com o S3 (ou outro serviço semelhante) e não com o NFS. Se este é o caso de um loop infinito, tenho que me perguntar por que isso não está acontecendo na configuração de produção atual (em vigor há mais de 2 anos). Ambas as configurações estão executando a mesma base de código com os mesmos dados.

UPDATE 2 - uma mensagem de log mais completa

[ 2014-08-30 01:30:15.3001 10515/7f654de0b700 Pool2/Implementation.cpp:287 ]: Could not spawn process for application /workspace/app/app: An error occurred while starting the web application: it did not write a startup response in time. Error ID: c8940e97 Error details saved to: /tmp/passenger-error-Z0k9GY.html Message from application: An error occurred while starting the web application: it did not write a startup response in time. Please read this article for more information about this problem.

Raw process output here (html output of the server settings basically)

[ 2014-08-30 01:30:15.3091 10515/7f654e84d700 agents/HelperAgent/RequestHandler.h:2306 ]: [Client 27] Cannot checkout session because a spawning error occurred. The identifier of the error is c8940e97. Please see earlier logs for details about the error.

    
por adamo 30.08.2014 / 11:36

0 respostas