Atualmente, estamos presos em uma situação em que estamos usando nginx
como nosso principal servidor front-end para um conjunto de serviços apoiados por uma descoberta dinâmica de serviço baseada em DNS com o Mesos-DNS.
Nossa configuração nginx parece um pouco com isso;
http {
resolver 10.10.1.1 valid=1s; // some internal DNS server
}
server {
set $core_api core-api-service.marathon.mesos; // some internal DNS
location /api {
proxy_pass $core_api:8080; // resolve core_api DNS dynamically to one of the IP's of the slave the process is running + listening on
}
}
Agora, o problema é que essa configuração funciona corretamente, mas uma de 4-5 solicitações sempre resulta em um Nginx retornando um 404, o que não faz sentido porque nenhum dos serviços executados dentro do cluster foi movido para um escravo diferente.
Agora, o resolvedor valid=1s
é bastante agressivo, então o estendemos para períodos mais longos, pensando que talvez ele estivesse consultando o DNS com muita frequência. Mas qualquer valor lá causa os mesmos problemas. Remover o valid=xx
também não ajuda.
O que está acontecendo aqui? Como mitigamos isso?
Obrigado.
EDIT (configuração completa)
server {
listen 80;
server_name .myapp.com;
return 301 https://www.myappname.com$request_uri;
}
server {
listen 80;
gzip on;
gzip_min_length 1100;
gzip_buffers 4 32k;
gzip_types text/plain application/x-javascript text/xml text/css;
gzip_vary on;
root /usr/share/nginx/www;
index index.html index.htm;
include /etc/nginx/mime.types;
server_name api.myappname.com;
error_page 404 /static/404.html;
error_page 403 /static/404.html;
error_page 503 /static/503.html;
error_page 502 /static/502.html;
set $core_api http://core_api.marathon.mesos;
location /api {
if ($http_x_forwarded_proto != 'https') {
rewrite ^ https://$host$request_uri? permanent;
}
limit_req zone=one burst=35;
limit_req_status 503;
proxy_pass $core_api:8080;
proxy_set_header X-Real-IP $remote_addr;
}
}