Como os marmanjos monitoram seus servidores?

4

Eu estou querendo saber qual software os caras da escala da Web estão usando para monitorar seus n arrays de servidores no (s) farm (s) de servidores.

O que o facebook, twitter, digg usa? Como o Google faz isso?

Estou procurando uma solução para nossos próprios requisitos de monitoramento. Nossos servidores ficam na nuvem, o AppEngine & EC2 Estamos procurando monitorar a "aplicação" (que é construída a partir de muitos serviços pequenos), o que significa que o resultado final deve ser um sistema que possa monitorar tanto o tempo de resposta (+ alivenss e co.) Quanto a validade da aplicação: deve acontecer, depois de 2 horas verificar o Z foi processado e T foi anexado ao log correto ...

A solução ideal seria um sistema para o qual eu possa implantar testes de unidade, os mesmos testes de unidade que estou usando para testar o software durante o desenvolvimento.

Recomendações, sugestões, comentários são muito bem-vindos. Estou procurando instruções para atacar esse problema.

Obrigado Maxim.

    
por Maxim Veksler 21.09.2010 / 19:32

1 resposta

10

Eu assisti isso há um tempo atrás. É 'um dia na vida das operações do Facebook'. Eles usam cfengine2 (implantação), nagios (monitoramento), gânglios (monitoramento e tendências), além de muitas ferramentas internas. Engraçado ver algumas das ferramentas que usamos são usadas em uma escala tão grande (+60.000 servidores)

    
por 21.09.2010 / 19:41