O que é uma manutenção regular que você precisa executar no seu servidor Linux?

7

Eu tenho um servidor que hospeda poucos sites, eu não fiz nenhuma manutenção por cerca de 2 meses além de olhar para alguns logs e compactá-los.

Basta saber o que é uma manutenção regular que você precisa executar no seu servidor Linux? Existem scripts que permitem fazer a manutenção?

    
por Max Thomson 14.04.2011 / 01:48

6 respostas

10

O mais importante é manter seu servidor monitorado para que você saiba o que está acontecendo no servidor a cada momento. É importante acompanhar o uso do disco, o uso da CPU, a carga, o uso da memória, o tráfego etc. Há muitas ferramentas de software livre que podem ajudá-lo nessa tarefa. Isso também ajuda você a planejar futuras atualizações.

Por outro lado, você precisa realizar backups regulares e automáticos e é muito importante testar seus backups de vez em quando para garantir que eles estejam funcionando.

Também é importante verificar as atualizações, especialmente as de segurança, e instalá-las quando necessário.

Tudo o que pode ser feito de forma automática deve ser feito de forma automática, mas não se esqueça de verificar seus registros de vez em quando.

Espero que isso ajude!

    
por 14.04.2011 / 02:19
3

Existem duas classes úteis de ferramentas aqui:

  1. Ferramentas de monitoramento , como Nagios , permitem acompanhar o uso e outras estatísticas.
  2. Ferramentas de gerenciamento de configuração como Marionete e Chef permite que você faça declarações sobre o estado esperado de um sistema (quais pacotes ele deve ter instalado, qual o conteúdo dos arquivos, etc.) e, em seguida, execute periodicamente para garantir que o sistema esteja em conformidade.
por 14.04.2011 / 02:31
3

Corrija seu sistema operacional para obter as últimas correções de bugs e atualizações de segurança. Este é o passo mais importante que você pode dar. Além disso, você precisa ter monitoramento para informar o estado do sistema ao longo do tempo. Eu tenho que discordar do ponto acima que o monitoramento não é manutenção. Você precisa ter uma compreensão básica do seu sistema e como ele funciona para ver quando as coisas não estão funcionando ou precisam de manutenção. A única maneira de realmente fazer isso é representar graficamente tudo. Nós usamos uma combinação de Nagios, cactos e gânglios para isso.

No que diz respeito a scripts, você mencionou a compactação de logs, então olhe logrotate. Há também logwatch.

    
por 14.04.2011 / 05:30
3

Os anteriores a esta pergunta são todos dignos de respostas, mas são todos coloridos pelo pensamento em larga escala. Se você tiver apenas um único host, fornecendo sites cuja falha não irá matar imediatamente os gatinhos, você pode querer pensar um pouco menor. Eu sugeriria o seguinte:

Use o logwatch ou sistema similar que agrega seus logs e envia um resumo para você. Leia o resumo pelo menos a cada dois dias. Use uma ferramenta que tritura seus weblogs (por exemplo, analógico) em um resumo legível. Se você quiser ser um pouco mais ambicioso, use um serviço de nuvem para monitorar seus sites.

No entanto, a essência da manutenção de sistemas permanece a mesma: mata cada edição que ocorre morta para que nunca ocorra novamente . Este é um ponto importante, porque significa que não deve haver manutenção "regular".

Agora, para a escala maior:

Entre os primeiros problemas que você tem quando escala, algo quebra e você não o conhece. Isso nunca deve ocorrer novamente. Então você obtém uma solução de monitoramento em grande escala. Além disso, tendo visto o problema ocorrer em um host, você deseja evitar que ele ocorra em qualquer outro host. É quando você obtém um sistema de gerenciamento de configuração.

Mas você não deve, neste momento, ser complacente. Todo o seu esforço deve entrar em soluções permanentes .

    
por 16.04.2011 / 20:52
1

A manutenção é feita pelo monitoramento. Se você tem uma máquina exposta ao acesso externo, você precisa ter algumas ferramentas de verificação: rkhunter, chkrootkit são básicos com emails enviados diariamente .. O smartd deve verificar os hdds e enviar mensagens caso algo comece a dar errado, tripwire para verificador de integridade, ajudante para o verificador de integridade IDS +, e muitos outros .. é claro que é suposto que o sistema já está endurecido (pelo menos com a política padrão do SElinux), Seria ótimo para fazer monitoramento de desempenho com nagios, zabbix e outros .. (para manter o olho em fora de eventos comuns e status da máquina)

    
por 14.04.2011 / 02:23
1

Marcos fez um bom resumo dos pontos comuns de MANUTENÇÃO: monitoramento, backups e atualizações.

Eu preciso repetir (com comentários de pessoas) que monitorar! = manutenção.

Eu gostaria de adicionar: limpezas de usuários antigos, tarefas antigas do cron, etc. Renovações de senhas. Evolução da configuração do sistema (olhando para o histórico de monitoramento) (e isso inclui a evolução do monitoramento e backups) com as mudanças de vida do servidor. Segurança auditorias . Relatórios personalizados (por exemplo, uso detalhado de serviços, recursos compartilhados, relatórios de segurança). E ...

Restaurar backups aleatoriamente (sem precisar fazer isso). Sempre inclua sempre uma cópia do MBR (Master Boot Record) se você não usar um sistema de implantação automatizado para restaurar o servidor inteiro.

Eu vi firewalls sobreviverem a 500 dias de atividade (sim, isso é uma manutenção BAD, porque há cerca de 10/15 atualizações de kernel por ano, então grandes uptimes , costumam ser iguais a kernel vulnerável ) sem qualquer manutenção humana. É apenas uma boa configuração em partições, syslog e sem grandes alterações de configuração.

Você solicita scripts . Talvez existam scripts genéricos pré-empacotados, mas é mais sobre DIY (Do it yourself). Então, primeiro você aprende ou lê como seu sistema funciona (isso inclui REAMEs específicos da distribuição, man pages, políticas e opções de compilação), então yo < em> pense como seu sistema deve se comportar, e então você escreve scripts personalizados (cron, comandos personalizados, etc) para gerenciar a combinação de SO + comportamento desejado / resultados / relatórios / gerenciamento de mudanças / reversões / reações / etc.

Além disso, as ferramentas genéricas disponíveis (monit, nagios, cacti, zabbix, etc.) podem ser estendidas com suas habilidades de script e disponíveis party plugins .

No exemplo: você precisa apenas saber "se a partição está cheia", ou precisa também controlar a temperatura do disco, inodes livres, direitos de arquivos e pastas, somas de verificação, S.M.A.R.T. status, setores defeituosos, verificações de sistema de arquivos e ciclo de vida estimado do hardware físico?

E, além dos backups, o sistema de monitoramento + personalizações deve ser validado quando possível, simulando falhas, ataques, etc.

Scripts personalizados são melhores, quando você pode validá-los e limpar bugs, em um servidor de pré-produção, ambiente, diretório, banco de dados, etc.

    
por 16.04.2011 / 21:41