Padrão de administração do sistema [closed]

6

Recebi a responsabilidade de gerenciar uma equipe de 4 administradores de sistema. Eles estão gerenciando mais de 70 servidores. Eles ainda não têm processos / procedimentos / práticas escritos. Eu não sei muito sobre administração de sistemas. Existe um padrão que podemos seguir para padronizar nosso trabalho ou escolher as melhores práticas?

    
por newbie 17.03.2011 / 08:55

8 respostas

12

Eu endossaria o que os outros disseram sobre não entrar e estabelecer a lei. Você diz que a equipe, no momento, está gerenciando mais de 70 servidores, então minha primeira pergunta é: como eles estão indo bem ? Há muito tempo de inatividade não programado, interrupções de trabalho, constantes lutas para consertar o material antes que ele exploda? Ou eles estão fazendo um bom trabalho do ponto de vista de prestação de serviços, com apenas um desastre imprevisível ocasional do tipo que acontece com todos nós para estragar a paz?

Se é o último, então você tem uma boa equipe que parece saber o que está fazendo e não tentando consertar o que não está quebrado é uma parte importante de não colocar o seu equipe faz o backup.

Se for o primeiro, você ainda pode ter uma boa equipe; boas equipes podem fracassar por causa da falta de apoio e engajamento da empresa (sem orçamento para o novo kit, nenhum acordo sobre compensação para o trabalho da meia-noite que seria necessário para atualizar as coisas sem interrupções de trabalho, nenhum acordo claro sobre SLAs) ou fricções internas, ou uma série de outras razões não-técnicas.

Se é o primeiro, é claro, você pode ter uma equipe inadequada.

A resposta correta varia descontroladamente nesses três cenários e também será afetada pelas personalidades envolvidas.

Se você tem um bom time, está trabalhando bem, então deixe-os guiá-lo. O que eles estão fazendo está certo, mas você precisa entender o que eles fazem e como. Eles lhe dirão, se você perguntar, e se você perguntar muito bem, provavelmente lhe dirão da maneira mais útil, escrevendo tudo. Análises anuais e metas acordadas são uma boa maneira de inserir mais documentação na vida do administrador de sistema. Essencialmente, o que eles estão fazendo agora está próximo das melhores práticas, então tente fazer com que documentem de uma forma mutuamente útil, em vez de impor algo a elas.

Se você tem uma boa equipe trabalhando mal, eles provavelmente sabem o que precisa mudar para se tornar uma boa equipe trabalhando bem. Ouça-os e descubra como converter suas necessidades em requisitos justificados para serem repassados ao negócio. Você pode adicionar muito valor como a ponte entre o mundo da tecnologia e o mundo dos negócios, se você estiver preparado para ouvir ambos lados e disser "não" para ambos em medida adequada.

Se você tem um mau time trabalhando mal, então você tem seu trabalho cortado para você. Identificar e documentar o que está errado será importante para poder disciplinar e, se necessário, substituir pessoas sem expor a empresa à responsabilidade. Identificar os frutos mais fáceis - coisas que poderiam ser facilmente empurradas para ir bem - é importante para obter alguns ganhos rápidos de motivação de equipe e credibilidade nos negócios, e baselining o que está errado é útil para mostrar que algumas melhorias rápidas foram feitas. .

Vejo que saí um pouco do assunto, mas acredito sinceramente que as melhores práticas e a padronização existem para satisfazer as necessidades dos negócios e das pessoas para realizar o trabalho, em vez de ser um ponto alto de excelência em documentação. sozinho no vácuo, então minha resposta reflete minha abordagem interconectada. Me desculpe se for overlong!

    
por 17.03.2011 / 11:56
8

Considere começar com o ITIL: link

ITIL gives detailed descriptions of a number of important IT practices and provides comprehensive checklists, tasks and procedures that any IT organisation can tailor to its needs.

Não espere ler um livro ITIL e saiba tudo, mas é um bom lugar para começar. Pulando depois de ler o ITIL e dizendo aos administradores do sistema "a nova lei" pode te dar alguns administradores infelizes.

O que eu sugiro é sentar e discutir com eles qual a melhor forma de melhorar a documentação e como cobrir o tempo de rastreamento / etc.

    
por 17.03.2011 / 08:59
8

Você pode querer começar com A Prática de Administração de Sistemas e Redes, Segunda Edição de Thomas A. Limoncelli , Christina J. Hogan e Strata R. Chalup. Existem algumas boas práticas recomendadas que ajudarão você e sua equipe no caminho certo. É bem realista e fácil de ler, apesar de seu tamanho.

O ITIL é uma coisa boa para se ter em mente, mas é muito fácil para as pessoas novatas na ITIL se esforçarem para tentar implementar tudo o que descreve ao pé da letra. Use o que você precisa, lembre-se do que você pode precisar depois, mas não deixe que ele evite fazer o trabalho que seus clientes esperam.

    
por 17.03.2011 / 10:51
3

As outras respostas dão conselhos práticos específicos sobre coisas como ITIL, o que eu acho bom. No entanto, tenha em mente que muitos dos padrões realmente se resumem a fazer a coisa sensata e fazê-la de uma maneira repetível. Você precisa gerenciar seus servidores de forma consistente com as ferramentas de gerenciamento de configuração, como o Puppet ou o Chef. Você precisa acompanhar o maior número possível de métricas e ser o mais transparente possível com seus usuários. Se você geralmente pensa no grande cenário de fornecer um serviço de qualidade e manter seus clientes ou usuários satisfeitos, você se sairá bem. O fato de você estar pensando em padrões é um bom sinal.

Um livro que li recentemente sobre vários desses tópicos foi Operações na Web . Ele tem alguns bons conselhos sobre como fazer coisas como gerenciar post mortem de incidentes e como coletar métricas. Recomendado.

    
por 17.03.2011 / 10:24
3

Como administrador de sistema, recomendo que você concentre sua equipe em:

  1. Documentação - não apenas descrições de sistemas, mas também alterações de log, documentação de todas as ferramentas personalizadas e assim por diante
  2. Servidores e monitoramento de serviços
  3. Implementação / configuração automatizada

Esses três aspectos devem tornar sua equipe produtiva, e os membros de sua equipe devem ser substituídos.

    
por 17.03.2011 / 12:28
1

ITIL e COBIT são os padrões líderes. Out company trabalha com o ITILv3, mas também houve um monitoramento de TI baseado no COBIT.

Vale a pena uma olhada rápida também: link

    
por 17.03.2011 / 09:23
0

A primeira coisa em que você deve questionar sua equipe é o backup e a recuperação - verifique se isso está coberto. Como diz Tom Kyte em relação à administração do banco de dados, backup e recuperação são a única coisa que você não pode se dar ao luxo de errar. Reveja isso primeiro, documente-o, especialmente quaisquer riscos e o nível de serviço que você possa comprometer e colmatar quaisquer lacunas entre a realidade e a expectativa do negócio.

    
por 17.03.2011 / 15:44
0

Obtenha feedback dos administradores de sistema (e possivelmente até dos desenvolvedores) sobre como os processos poderiam ser melhorados. Eles são sua fonte número um de informações e conhecerão melhor os problemas e os gargalos do que qualquer outra pessoa.

Certifique-se de que o processo de documentação esteja pronto e automatize o máximo possível. As pessoas sempre esquecem de adicionar notas aos wikis sobre implantações e atualizações. Considere escrever um painel do servidor que permita verificar rapidamente como todos os servidores estão sendo executados e quais versões do software estão instaladas em várias caixas.

Automatize, automatize e automatize (e documente todas as automações).

    
por 17.03.2011 / 15:57