Possível problema de IO do disco

3

Eu tenho tentado realmente descobrir quais são as minhas IOPS na minha matriz de servidores de banco de dados e ver se é demais. A matriz é quatro unidades de 72.6gb 15k rpm no RAID 5. Para calcular o IOPS para o RAID 5, a seguinte fórmula é usada: (reads + (4 * Writes)) / Number of disks = total IOPS . A fórmula é de MSDN . Eu também quero calcular o Comprimento Médio da Fila, mas não tenho certeza de onde eles estão tirando a fórmula, mas acho que ela lê na página como avg que length/number of disks = actual queue .

Para preencher essa fórmula, usei o perfmon para reunir as informações necessárias. Eu vim com isso, sob carga de produção normal: (873.982 + (4 * 28.999)) / 4 = 247.495 . Também o tamanho da fila de disco de 14.454/4 = 3.614 .

Então, para a pergunta, estou errado em pensar que este array tem um disco IO muito alto?

Editar
Eu tive a chance de revisá-lo novamente esta manhã sob carga normal / alta. Desta vez, com números ainda maiores e IOPS em excesso de 600 por cerca de 5 minutos, ele diminuiu novamente. Mas também dei uma olhada nos Avg sec/Transfer , %Disk Time e %Idle Time . Esse número foi obtido quando as leituras / gravações por segundo eram de apenas 332.997 / 17.999, respectivamente.

% Tempo de Disco: 219.436
% Tempo ocioso: 0,300
Comprimento médio da fila de disco: 2,194
Média de disco s / transferência: 0,006
Páginas / seg: 2927.802
% De tempo de processador: 21.877

Editar (de novo)
Parece que eu resolvi esse problema. Obrigado pela ajuda. Também para um parser bem engenhoso eu encontrei este: link Ele funciona muito bem para dividir os dados em algo utilizável.

    
por Tim Meers 15.01.2010 / 16:39

1 resposta

4

Eu tenho feito um pouco de pesquisa nesta área ultimamente. Há uma ótima calculadora aqui que as pessoas neste site me indicaram. Colocando alguns números básicos nele com uma taxa de leitura para gravação de 97: 3 e não considerando os acertos do cache, parece que sua matriz deve ser capaz de fornecer mecanicamente cerca de 675 IOPS a 4k. Você está fazendo 902 transferências por segundo, o que seria alto, já que o tamanho da sua fila por disco também indica.

Você também pode medir sec / Transfer e% Disk time. Descobri que% Disk time é um pouco estranho com matrizes RAID, e achei mais preciso medir% Idle time e depois usar a fórmula 100 -% Idle para calcular o tempo ocupado. Aposto que você descobrirá que seu disco está muito ocupado e você verá muitos 20ms + tempos de transferência. IMO esses números são mais claros se você quiser concluir que você tem um problema de disco.

Aqui está um ótimo artigo que é bastante referenciado. É datado, mas relevante, e é especialmente útil para explicar por que% Tempo de disco e CPC méd. O comprimento da fila pode ser difícil de interpretar.

    
por 15.01.2010 / 17:16