Como descobrir rapidamente se um servidor * nix está funcionando OK?

3

Muitas vezes, quando me encontro diante de um console unix / linux (ou qualquer outra variante * nix) e preciso diagnosticar rapidamente a condição do servidor, não consigo me lembrar de tudo que deve ser verificado.

Vou tentar um vmstat, algumas manobras ps / top, ler procinfo e alguns arquivos de log (boot & sys), mas o que eu realmente gostaria é de uma maneira rápida de visualizar a condição de Cpu, Hard disk e Physical Memory .

Eu pareço saber que muito disso já está presente no vmstat, mas de alguma forma eu sinto falta da facilidade do servidor 2008 onde você pode encontrar um bom monitor de recursos enquanto o próprio gerenciador de tarefas pode dar uma espiada na condição do sistema ( e nem mesmo falando sobre as ferramentas gráficas de monitoramento do servidor 2008).

Alguma sugestão, ou eu estou apenas sendo coxo porque vmstat realmente é o graal?

Editar:  Bem, obrigado pelo feedback, todos. Devo acrescentar que não estou realmente falando sobre monitoramento constante (onde nagios é uma proposta muito boa), mas sobre uma caminhada ocasional para um servidor - não necessariamente meu - para fazer uma pesquisa rápida de condição do sistema (às vezes eu simplesmente sou em algum lugar e Bang, Hey, você pode vir aqui para verificar isso?)

O stick com alguns utilitários-scripts é realmente bom, já tem um com sysinternals apps para máquinas windows. O Htop é legal também, embora eu não ache que seja capaz de instalá-lo onde quer que esteja.

    
por Berzemus 05.06.2009 / 12:58

6 respostas

3
O

top é uma boa ferramenta (se instalada), mas o outro que eu gosto para ver rapidamente se algo está errado é dmesg . Isso deve deixar você saber se o servidor está experimentando algo incrivelmente importante (nics desconectadas, falhas de disco, falhas de memória, etc.).

    
por 06.06.2009 / 22:27
7

Se você quiser um pouco de sinos e assobios no linux - tente htop .

é top em esteróides, você pode configurá-lo para exibir em tempo de CPU cpu gastar em userland / system / iowait / irqs. isso pode dar uma boa visão do que é a causa da carga.

ainda - algumas informações que você recebe do vmstat não serão exibidas no htop.

você também pode dar uma olhada no sar em sysstat . [O iostat mencionado por Kyle Brandt faz parte do mesmo pacote].

    
por 05.06.2009 / 13:07
4

Dependendo de quantos servidores você tem, pode querer configurar nagios ou um sistema de monitoramento semelhante para isso. Basicamente, você define limites nas métricas (uso da CPU, uso de memória, etc.) e, se um limite for excedido, você receberá um alerta, que pode ser uma página ou um email ou o que for. No entanto, se este for seu computador doméstico, eu me encontro usando nmon . É ótimo para obter uma imagem completa do seu sistema. Ele exibirá informações sobre a memória, o disco, a CPU e o uso da rede, bem como informações sobre o kernel.

    
por 05.06.2009 / 13:58
1

Não se esqueça do iostat, parte do pacote sysstat. Se você quer algo que seja facilmente portável, por que não escrever um script shell ou Perl que você possa desenvolver com o tempo? Essa seria uma boa maneira de aprender as diferenças entre os sistemas e ficar melhor no script. Você pode geralmente analisar a maior parte das informações fora do proc ou simplesmente encerrar todas essas ferramentas.

    
por 05.06.2009 / 13:31
0

Geralmente, executo o topo como um primeiro ponto de chamada quando faço login em um host que relatou problemas. Ele oferece uma boa visão geral da CPU, memória, comprimento da fila de execução e, a partir disso, eu posso ter uma ideia do que investigar a seguir. Se iowait é para cima eu olho para iostat se a memória é baixa eu ps e ver quais processos estão usando memória (ou apenas ordenar top por memória) etc ...

A coisa bonita sobre o unix é que você não precisa aceitar as ferramentas oferecidas. Escreva um script que mostre as informações que você deseja.

iostat vmstat topo ps (lembre-se você pode personalizar os campos de saída do ps - bastante q perdido com o gnu ps) df dmesg / var / log / messages sar Você pode usar o syslogNG para filtrar todas as mensagens de log crtical em um arquivo de log separado.

Uma coisa incomum (ish) que vale a pena verificar no linux é / proc / mounts. Às vezes, o sistema de arquivos é lido apenas, mas isso não é mostrado pela montagem, mas é mostrado em / proc / mounts. Eu vi isso tanto nas VMs quanto no armazenamento do FC (por exemplo, onde um caminho desapareceu de uma maneira estranha).

    
por 01.08.2010 / 16:44
0

Outro programa "top on esteróides": em cima . Tão detalhado, é assustador.

    
por 01.08.2010 / 16:48