Tarefas Sysadmin diárias / semanais / mensais / anuais

8

Isso provavelmente deve ser um wiki da comunidade. Eu estou tentando chegar a uma lista de todas as tarefas de sysadmin que deveríamos estar fazendo em uma base regular, porque acredito que não estamos fazendo o suficiente em nossa empresa. A atitude por aqui é que os problemas de conserto são inconvenientes, mas não temos tempo para fazer manutenção preventiva ou melhoria contínua.

Diariamente:

  • troca de fita / unidade de backup noturno
  • verifique se as atualizações de antivírus foram enviadas para todos os sistemas

Semanalmente:

  • troque a fita / unidade de backup semanal
  • limpa arquivos temporários de todos os sistemas
  • desfragmentar todos os sistemas

Mensalmente:

  • planejar melhorias na infraestrutura
  • entrega / envia equipamento obsoleto para o reciclador de eletrônicos
  • reconstruir ou substituir estações de trabalho antigas
  • teste a restauração a partir do backup

Anual:

  • reconstrua ou substitua servidores antigos
  • substitua as baterias do no-break
por Scott 14.10.2010 / 22:42

6 respostas

7

Se você não tiver tempo suficiente para fazer manutenção preventiva e passar a maior parte do tempo resolvendo problemas, toda a sua metodologia precisará ser revisada. Em vez de dizer o que você deve fazer a cada período, darei algumas idéias para que você não tenha que fazer as coisas.

Se você precisar de um bom sistema de monitoramento e da maior automação possível. Esses dois itens devem liberar mais tempo do que muitos administradores percebem até que tenham configurado bem.

Apenas algumas das coisas que seu sistema de monitoramento deve fazer por você são:

  • Alerte quando as filas de filtros de e-mail ou spam ficarem muito grandes ou muito repentinamente.
  • Alerte quando o espaço em disco ficar muito baixo, o uso da CPU ficar muito alto, etc.
  • Grave coisas como a utilização do disco para que você possa ver as tendências ao longo do tempo.
  • Mesma coisa com caixas de correio.
  • Alerte quando o firewall registrar um número anormal de ocorrências.
  • Mesma coisa para qualquer coisa servindo ao mundo exterior. por exemplo. DNS e servidores da web.
  • Alerte se as atualizações de antivírus são muito antigas se qualquer máquina tiver o software antivírus desativado ou desinstalado.

A desfragmentação não deve estar na sua lista de tarefas, porque deve ser um processo automatizado. Em seu intervalo desejado, o servidor deve executar verificações de disco e uma desfragmentação após a reinicialização. Considere ligar isso com um sistema para instalar atualizações e patches enfileirados (que foram testados anteriormente em uma máquina que não seja de produção).

Pastas temporárias também podem ser limpas com automação. Eu crio um aplicativo simples que é acionado após uma reinicialização que aguarda 10 minutos e depois limpa todos os locais temporários. O atraso é garantir que ele não exclua arquivos que possam ser necessários para uma instalação ou atualização que seja concluída após a reinicialização (aprendido da maneira mais difícil!).

Uma coisa que você deve fazer manualmente, em qualquer período de tempo, é monitorar o sistema de monitoramento e a automação, apenas para estar seguro. Eu verifico o meu diariamente, mas ainda não encontrei um problema há mais de um ano.

Quando você fizer o seu sistema e automação, certifique-se de ter um sistema de controle de versão para colocá-lo. Pode ser muito desagradável descobrir que o último pequeno ajuste quebrou outra coisa, mas você não consegue lembrar exatamente o que mudou .

    
por 14.10.2010 / 23:27
1

No Daily, eu teria Check Event Logs, manualmente ou através de algum script.

Talvez o Monthly possa incluir atualizações do SO?

Eu diria também anualmente dar uma olhada onde a manutenção / garantia está em seus servidores.

    
por 14.10.2010 / 22:50
1

Mensalmente:

  • analisa o uso da infra-estrutura - isso é discutível com o 'plano de melhorias na infraestrutura', mas você não pode fazer planos a menos que você saiba (ou seja, 'tenha dados concretos') quais bits precisam ser melhorados.

Trimestral:

  • Teste de failover de infraestrutura - da camada de aplicativo (servidor da web, email) à camada de rede (switch, link de rede) à camada física (energia), se você tiver redundância no sistema que espera poder poupar você, ele precisa ser mantido e testado periodicamente.
por 14.10.2010 / 23:24
1

Aqui estão alguns backups mensais que você pode não ter pensado:

1) Even if automated, I still copy my core network switch config to a local machine
2) Firewall configs
3) SAN configs
4) exported ISA configs (win 2003)
5) DHCP static reservations (win 2008)
6) DNS entries (win 2008)
7) Encryption keys (stored in binary files) to KeePass, especially since our backups are encrypted - additionally saved outside of our backup systems
8) our IT documentation folder, additionally saved outside of our backup systems
    
por 14.10.2010 / 23:40
0

No dia-a-dia, recomendo que você adicione assinaturas às listas de discussão de vulnerabilidades de patch conhecidas e tenha um processo de atualização / atualização.

Isso pode acontecer apenas uma vez por mês, mas é preciso apenas que uma mensagem perdida sobre uma vulnerabilidade de produtos cause muitas interrupções.

Acho que isso pode ser reduzido a algumas palavras para caber em uma linha, se você concordar.

BTW; Esta é uma ótima lista, estou ansioso para ver sua conclusão /.

    
por 14.10.2010 / 22:48
0

Auditorias Internas:

  • Compare os sistemas que foram publicados com a lista de sistemas que estão sendo armazenados em backup. Alguma coisa entrou na produção sem backup? (pelo menos mensalmente, se não com mais frequência, dependendo de quanto é implantado)
  • Acesse suas fitas se você tiver um cofre externo. Certifique-se de que eles estão onde deveriam estar. (uma ou duas vezes por ano)
por 14.10.2010 / 23:59