Como você administra 20 ou mais Servidores Linux diariamente?

5

Estou pesquisando sobre a maneira mais eficiente de administrar 20 servidores Linux e 100 estações de trabalho Linux de forma centralizada.

Não tenho certeza se existe algum Conjunto de Administração e Monitoramento para realizar o trabalho diário de administração e solucionar problemas de uma única estação.

    
por Paul Stevens 20.11.2009 / 05:21

4 respostas

8

Eu tenho um site com quarenta estações de trabalho e cerca de quinze nós de computação.

Eu gerencio as estações de trabalho:

  • forçando os engenheiros a armazenar todos os dados na rede NFS, não localmente
  • não permitindo que qualquer engenheiro tenha raiz em qualquer estação de trabalho por qualquer motivo
  • ter todos os sistemas syslog em um host syslog-ng central, com a análise de log acontecendo em intervalos regulares (geralmente diariamente, mas às vezes com freqüência de hora em hora)
  • monitore up / down com nagios
  • ter um ambiente de kickstart repetitivo - regra geral, se um problema não pode ser corrigido em trinta minutos, a máquina recebe o kickstart novamente (na prática, nós realmente aceleramos muito mais rápido que isso porque nessa configuração raramente há trinta minutos de solução de problemas que podemos fazer), e se o kickstart falhar, começaremos a trocar o hardware

Eu gerencio os farms de computação praticamente da mesma maneira, exceto:

  • existe um diretório local / rascunho onde qualquer pessoa pode escrever qualquer coisa - no entanto, o conteúdo desse diretório não é garantido
  • os contadores de desempenho / uso são feitos através do munin de um host central
  • A atividade de rede é feita usando cactos para monitorar as portas do switch nas quais os nós do farm estão conectados.

Não é perfeito, mas manteve este site em funcionamento.

(Ah, devo mencionar que este site não tem nenhuma equipe de TI em tempo integral no local, é PT e sob demanda. Os sistemas de monitoramento acima geralmente podem avisá-lo quando há um computador em perigo. )

    
por 20.11.2009 / 15:12
4

Na automação de você tem várias opções, incluindo

No lado do monitoramento, sugiro Icinga ou Nagios que são basicamente idênticas.

Espero que isso ajude. A verdadeira coisa a fazer é planejar exatamente o que você deseja usar para automação e monitoramento e depois escolher a melhor solução com base em suas necessidades. Tudo tem suas próprias vantagens e desvantagens, planeje cuidadosamente e selecione o que você quer.

    
por 20.11.2009 / 05:52
4

Eu aproveito ao máximo o uso do chef para gerenciar a configuração dos meus servidores. Monit , SEC , Collectd e Icinga me ajudam a monitorá-los.

    
por 20.11.2009 / 06:26
3

Quais são suas tarefas de "administração diária"? Que distro você está correndo?

Os e-mails do cronômetro e do cron são muito úteis para ajudar você a se manter informado sobre o que está acontecendo nos seus servidores. Além disso, produtos como o Puppet podem ajudar a automatizar coisas como enviar pacotes, alterar configurações de firewall, etc. Há também ferramentas como < href="http://code.google.com/p/parallel-ssh/"> SSH paralelo que pode ajudá-lo a executar manualmente determinadas linhas de comando em vários servidores de uma só vez.

Se você estiver executando uma solução baseada no Debian, há um pacote chamado apticron que será executado periodicamente via cron e pode enviar um relatório por e-mail quando houver pacotes que precisam ser atualizados. Eu sei que existe um programa similar para as distros do tipo Redhat / CentOS, mas o nome está escapando de mim atualmente.

No que diz respeito ao monitoramento, há um grande número de pacotes que você pode conferir. Sou parcial ao Nagios, mas existem muitos sistemas gratuitos e pagos que podem fazer um bom trabalho. Sem dar mais detalhes, porém, é muito difícil dar boas recomendações para sua situação específica.

    
por 20.11.2009 / 05:44

Tags