Como você verifica se o servidor funciona corretamente?

1

Gostaria de saber como você verifica se o servidor funciona corretamente após algumas alterações de configuração ou instalação de patch? Achei difícil verificar, por exemplo, se todos os aplicativos em execução no servidor não foram afetados pelas alterações feitas por você.

Você conhece alguma maneira "automatizada" de verificar essas coisas?

    
por Marcin Obel 16.11.2009 / 12:13

4 respostas

2

É para isso que o monitoramento do sistema é usado. Você tem o sistema de monitoramento verificando todos os sites e serviços em execução no servidor e, em seguida, se você quebrar alguma coisa (ou se quebrar sozinho), você saberá sobre isso.

    
por 16.11.2009 / 12:23
2

Bem, o que você realmente precisa fazer antes de tudo isso, é determinar o que você está avaliando corretamente. Você precisa olhar para o seu servidor, e o que ele está fazendo e dizer, ok para este servidor estar funcionando corretamente, ele precisa estar fazendo X Y e Z com sucesso.

Isso pode ser que ele precise estar servindo corretamente as páginas da Web, recebendo e-mails e permitindo acesso FTP, para um servidor web. Se for esse o caso, então sim, você pode automatizá-lo, você pode ter alguns serviços de monitoramento ou scripts que verificam esses serviços ou acessam essas páginas da Web etc.

    
por 16.11.2009 / 12:26
1

O que você está procurando é chamado software de monitoramento . Veja por exemplo as coisas sob link para ter uma ideia.

A maioria dos softwares de monitoramento faz simples verificações fora da caixa (as portas / serviços do site / porta aberta, como FTP / SMTP / etc.) respondem. Se você precisar de verificações mais exaustivas (verifique se uma certa página da Web contém determinado texto, etc.), você precisará escrevê-las você mesmo (já que isso é específico do aplicativo), mas o software o ajudará.

Eu pessoalmente posso recomendar o ZenOSS, mas há muitos disponíveis.

    
por 16.11.2009 / 12:56
1

Depende do serviço do servidor, na verdade.

Para a maioria, você pode fazer o seguinte (fora do topo da minha cabeça);

  1. executar software de monitoramento como o Nagios para encontrar serviços não executados
  2. verifique se você tem um bom backup do sistema antes de fazer o atualizar; o backup deve permitir restauração de um servidor completo falha.
  3. Testar o serviço manipulado pelo servidor (abrir uma página web se for uma web servidor, envie um email para verificar e-mail está funcionando ...)
  4. Verifique os logs nos sistemas pós-reinicialização para mensagens de erro.

Você não pode realmente testá-lo totalmente ou saber se o sistema está funcionando, porque correções de bugs podem criar casos de borda onde ele não está funcionando corretamente sob certas circunstâncias.

Você quer dizer que deseja verificar se os serviços estão em backup nos servidores após as atualizações? Nesse caso, programas como o Nagios devem ser perfeitos. Você quer dizer testar se os servidores estão funcionando adequadamente? Isso, para meu conhecimento, significa escrever seus próprios casos de teste ou testar manualmente, pois, por exemplo, o servidor da Web pode aparecer, mas está enviando mensagens de erro porque o serviço de banco de dados do qual o servidor da Web depende está inativo.

EDIT: Ok, o NAGIOS pode monitorar no nível de serviço; Quero dizer que os serviços podem estar "lá", mas algo é afetado de uma forma que está dando erros, então confiar na automação dará uma falsa sensação de segurança. Tivemos casos em que o nosso sistema de telefone da Cisco (Callmanager) parecia estar funcionando bem apenas para descobrir, depois de um bom período de tempo, que certos correios de voz não estavam roteando adequadamente para o servidor de e-mail; nós não sabíamos até investigar os usuários dizendo que eles foram informados de que tinham correio de voz que nunca receberam ... o monitoramento automatizado de serviços não detectaria isso sem verificar especificamente os logs, pois tudo no Callmanager dizia que era funcional).

Se você tiver uma necessidade específica ou um caso específico, convém limitar um pouco e ver quais são os acessos que você recebe aqui. Eu vejo um paralelo semelhante no hardware; Como posso verificar se minha memória atualizada está funcionando no meu computador? "Arranque-o e use-o." Não significa que você não verá falhas estranhas porque a memória não está bem encaixada corretamente ou tem um pequeno defeito de fabricação que aparece em uma determinada faixa de temperatura, no entanto.

Esse é outro motivo para considerar a virtualização. Você pode minimizar os impactos de atualizações, facilitar a recuperação de problemas e compartimentar serviços mais facilmente a servidores individuais (o servidor da Web lida com tarefas da Web, etc.), bem como monitorar o uso do disco e da rede para obter uma imagem da integridade seus servidores um pouco mais facilmente. Apenas jogando isso lá fora, como algo a considerar, deve surgir a oportunidade: -)

    
por 16.11.2009 / 13:51