Determinar qual processo está causando E / S de disco pesado?

19

Eu vi essa pergunta:    Como identificar gravações pesadas em disco?

E eu usei dstat e no topo antes ... mas eles não parecem apontar qual processo está causando a E / S do disco. Por exemplo, do dstat:

dstat -ta --top-bio
----system---- ----total-cpu-usage---- -dsk/total- -net/total- ---paging-- ---system-- ----most-expensive----
     time     |usr sys idl wai hiq siq| read  writ| recv  send|  in   out | int   csw |  block i/o process
14-12 16:16:25| 22   3  49  26   0   0|2324k    0 |  17k 6144B|   0     0 |1324     0 |
14-12 16:16:26| 24   3  30  43   0   0|4960k 8192B|1498B 4322B|   0     0 |1494     0 |wget          0  4096B
14-12 16:16:27| 25   4  38  33   0   0|4612k  548k|5011B   27k|   0     0 |1582     0 |kjournald     0    24k
14-12 16:16:28| 23   3  42  32   0   0|5072k    0 |  24k 4368B|   0     0 |1495     0 |

Observe o quão alto é o dsk / total - entre 2 e 5 MB / s. Mas então olhe para a coluna 'mais cara' - são apenas alguns bytes aqui, um par de KB lá e às vezes até nada. É o mesmo tipo de coisa "no topo". Mostra alto uso geral do disco, mas baixo uso de processos individuais. Estou rodando o CentOS 5, kernel 2.6.18-53.

Preciso de uma versão mais recente do kernel? Talvez alguma configuração de configuração do sistema em algum lugar? A homepage 'atop' recomenda a instalação de alguns patches do kernel, mas eu prefiro não passar pelo incômodo de configurar & compilando meu próprio kernel.

    
por davr 14.12.2010 / 23:25

1 resposta

26

iotop ( link ) para iniciantes;) Eu não vi você postando uma saída dele.

1: Eu experimentei quase a mesma situação com um sistema de arquivos logging e atime - no entanto, com mais gravações.

Tente remontar com noatime e desativar o registro do sistema de arquivos (mais tarde somente para testes) para ver se ele é baseado no sistema de arquivos e, como foi dito, se o iotop é baseado em processos.

2: Eu acho que esta partição não faz parte de uma matriz de raid apenas de reconstrução, é?

3: Se você está tendo muitos arquivos muito pequenos (muito menores do que os blocos de dispositivos de blocos reais e / ou o tamanho do bloco de arquivos), e você está lendo esses arquivos pequenos, você acaba lendo blocos inteiros do sistema , e a maioria desses blocos será lida por nada.

4: Se nada ajudar acima, você sempre pode obter a lista de arquivos acessados executando

echo 1 > /proc/sys/vm/block_dump

por favor note que degrada muito o desempenho do sistema. As instruções estão disponíveis no meu post anterior aqui

    
por 14.12.2010 / 23:34