Nós rodamos um cluster de 45 máquinas Linux com muitas coisas diferentes rodando (nginx, Varnish, Apache, MySQL, memcache, etc.) e carregamos balanceamento em máquinas diferentes. Fazemos cerca de 3000 solicitações por segundo e fazemos algumas solicitações muito pesadas em tempo real.
Já temos uma boa compreensão do Linux, mas continuamos enfrentando problemas de max_connections atingidos, SYN Cookies enviados, problemas de tabelas de IP, etc etc. Aprendemos com nosso syslog e o Google em torno dele e fazemos uma correção. Eu estou esperando para entender todos os diferentes parâmetros e coisas que importam em uma caixa Linux (perspectiva ubuntu / Debian) que eu deveria saber antes de executar um serviço muito pesado em uma máquina. O serviço deve receber muitos milhares de solicitações por segundo de pessoas em todo o mundo (diferentes IPs). Um servidor interage com vários outros servidores para concluir uma solicitação.
Existe algum livro / conjunto de livros, eu deveria entender o sistema linux e como ele lida com um pedido e quais parâmetros importam onde. Também qualquer documentação específica sobre nginx, verniz, memcache, LAMP, MySQL que eu deveria ler antes de escalar as coisas para muitos milhares de pedidos por segundo nível.
Obrigado