encher rapidamente o disco: como entender o que está acontecendo?

3

Eu tenho um processo org.apache.solr.hadoop.MapReduceIndexerTool/MorphlineMapper que preenche a montagem local '/'.

Ele é executado por alguns minutos, o disco é preenchido, os alertas do Nagios são disparados e eu mato o processo. Depois que o processo é eliminado, a utilização do arquivo cai para seu nível básico de 40%.

Isso acontece com bastante rapidez e, como é um sistema de produção, não há muito tempo para examinar o sistema de arquivos para ver quais arquivos são novos. Há também algumas montagens do NFS que fazem com que du -sh * seja interrompido. Estamos executando o RHEL 6.7.

Existe uma maneira inteligente de descobrir o que, exatamente, está preenchendo o disco? Talvez uma maneira rápida de capturar, diferenciar e agregar os tamanhos de arquivo de lsof ? Eu imagino que este é um cenário bastante comum e por isso pode ser um bom awk one-liner que está no kit de ferramentas de cada sysadmin.

    
por Alex Woolford 08.03.2016 / 01:50

1 resposta

2

Este evento parece ter 8 minutos de antes de estar completo. Isso seria um tempo de resposta incrível para evitar manualmente, especialmente se o administrador não estava no sistema quando começou.

Você precisa de mais tempo de reação. Dê mais espaço para mastigar. Acelere ou limite o trabalho de alguma forma.

O iotop é um ótimo script python para ver processos fazendo o máximo de E / S. O que provavelmente contém o seu fugitivo. Pode ter uma boa saída em lote com as opções certas, digamos iotop -bkto .

    
por 08.03.2016 / 03:05