iostat no Solaris com ZFS - por que esperar e% w sempre são zero?

3

Temos um servidor ocupado, chocando sob uma alta carga de IO, pelo menos, essa é a sensação que tenho. A saída de iostat -xz se parece com isso:

             extended device statistics                 
device    r/s    w/s   kr/s   kw/s wait actv  svc_t  %w  %b 
sd5     224.8  157.8 10701.8 6114.7  0.0  9.5   24.7   0 100 
sd5     243.2  110.4 11565.3 4065.0  0.0  9.7   27.5   0 100

É óbvio que o subsistema de disco está sobrecarregado, já que um tempo de serviço de 25 ms é inaceitável para um array SATA de 6 drives e um 100% ocupado também significa que estamos sobrecarregados com o disco rígido.

Mas - por que wait é sempre 0.0 ? E por que %w também é 0? %w às vezes vai para 1 e retorna rapidamente para 0 . Isso não significa que nenhum processo está esperando por IO?

O controlador RAID de alguma forma causa esse resultado / mascara os tempos de espera?

Alguém pode explicar esse comportamento?

    
por shlomoid 13.04.2011 / 13:42

2 respostas

2

O tempo svc_t mede em milissegundos a "ida e volta":

"bottom" do sistema operacional - subsustem de disco - "parte inferior" do sistema operacional

Não é completamente correto que "100% ocupado significa que estamos chocados no disco IO". Isso significa que o disco estava ocupado 100% do tempo fazendo algo, não necessariamente que não pudesse fazer mais do que isso, nem que atendesse pedidos no tempo (isso é uma diferença sutil).

Normalmente, os sintomas dos discos sobrecarregados são altos valores na coluna% w e atuam (constantemente acima de 200).

Poderia ser um problema de latência? O sistema solicita muitas operações aleatórias para que o controlador gaste tempo procurando o sexto fragmento de dados?

    
por 13.04.2011 / 14:22
1

Sim, acho que você está correto no controlador RAID bagunçando os números. Se ele informar ao motorista que a operação foi iniciada assim que for solicitada, o driver não saberá que ainda está aguardando o hardware do disco dentro do controlador RAID. Você pode retirar estatísticas do controlador RAID diretamente?

    
por 15.04.2011 / 00:34