Ferramentas para rastrear o uso do disco

4

Eu gerencio vários servidores de arquivos linux. Todos executam aplicativos escritos de 0 a 10 anos atrás. Como às vezes acontece, uma máquina chega perto ou fica sem espaço em disco. As razões incluem aplicativos que não rotacionam arquivos de log, uma máquina com 500GB de disco produzindo 150GB de novos arquivos todos os meses que não foram gravados em fita, bancos gradualmente aumentando de tamanho, pessoas fazendo bobagens ... geralmente um pouco de caos. >

De qualquer forma, quando uma máquina inesperadamente vai de 50% a 100% cheia em algumas horas, eu decido o que quebrou (muitos "du") e deletei arquivos ou entrei em contato com alguém. Eu também posso ver os gráficos do cacti para descobrir qual é o uso normal do disco da máquina (por exemplo, para / home).

Alguém conhece alguma ferramenta que forneça informações mais detalhadas sobre o uso histórico do que um gráfico cacti / RRD? Como "/ home / abc / xyz aumentou 50GB no último dia".

    
por Carey 26.02.2011 / 23:49

4 respostas

4

Eu acho que o ajuste de curva matemática pode ser uma resposta aqui, mas ainda não o explorei. Eu estava em uma palestra em que John Adams, do Twitter, falou sobre fazer isso por seu planejamento de capacidade e pareceu uma ideia útil.

Meu entendimento sobre ajuste de curva é que ele pega os dados existentes e fornece uma extrapolação de uso. Isso pode ser usado para responder a perguntas como "com base no uso atual, quando o nosso disco chegará 100% cheio?".

Aqui está uma página da Wikipédia sobre ajuste de curvas . O pacote fityk parece ser um bom lugar para começar.

Parece que é necessária alguma programação para fazer isso, eu não vejo nenhum plug-in drop-in simples para um pacote de monitoramento como o Cacti, infelizmente.

    
por 27.02.2011 / 02:07
3

Munin monitorará o uso do disco e enviará alarmes. Os gráficos serão semelhantes ao que você obteria com o cacti / RRD, pois Munin usa o rrd para armazenamento. Eu substitui nagios e mtrg com munin para muitas coisas. Existem usos para os nagios que não são cobertos pelo munin.

    
por 27.02.2011 / 04:06
2

Uma vez eu tive que fazer algo parecido. Eu resolvi o problema com um cron job que executava um du no sistema de arquivos afetado todas as noites e salvava a data do arquivo nomeado. Quando o servidor é preenchido, é fácil comparar o du atual com um dos arquivados e descobrir o que aconteceu. Isso também fornece ótimas informações sobre o crescimento ao longo do tempo para suas necessidades futuras de estimativa de disco.

    
por 27.02.2011 / 04:50
1

Você pensou em um monitoramento?

Talvez seja melhor você usar algo como o Nagios para monitorar seu servidor. E quando seu disco é mais de 90%, por exemplo, você recebe um e-mail como este.

Nesta solução, você pode usar o CACTI para procurar e ter um histórico, mas o Nagios o avisa se você tiver um ou mais estados críticos, por exemplo, quando tiver 70% de espaço em disco de aviso e 90% de aviso crítico.

E com o Nagios é apenas um exemplo você pode monitorar todos os seus servidores Linux com uma aplicação e não apenas os discos.

    
por 27.02.2011 / 03:30