Os números aparentemente insanos de% Disk Time indicam algo, mas a forma como% Disk Time é derivado por Perfmon significa que os números > 100% não são impossíveis.
% O tempo de disco é, na verdade, um contador calculado e é proveniente de:
Avg Disk Sec/Transfer * Disk Transfers/sec.
Avg Disk Sec / transfer leva a soma dos tempos de conclusão de todos os pedidos de veiculação no intervalo atual e divide pelo número de pedidos de veiculação que dão um final médio ao término do tempo de conclusão. Transferências de disco por segundo é simplesmente o número total de IOs completos dividido pelo intervalo.
Muitos desses pedidos de veiculação podem ter sido iniciados fora do intervalo atual para que o produto possa ser > 100%. Isso pode acontecer em qualquer sistema, mas excederá 100% mais frequentemente em matrizes de disco complexas, como uma SAN.
Por causa da maneira como é calculado% Disk Time não lhe diz muito, embora neste caso esteja dizendo que algo está errado. Calcular a utilização usando (tempo ocioso de 100%) é uma idéia melhor, pois o tempo ocioso é medido diretamente.
Os Comprimentos da Fila de Disco podem ser muito maiores do que seriam em uma configuração de armazenamento local simples, mas em geral se Comprimento da Fila for > > o número de fusos que suportam o LUN, então as coisas estão fazendo backup, especialmente se o Comprimento da Fila aumentar de forma constante por qualquer período de tempo significativo. Um valor de 10 ou até 20 em um LUN com 10-15 discos não seria um problema, mas 350 está definitivamente dizendo que algo está errado. Um Cache defeituoso ou mal configurado certamente poderia causar problemas como esse, mas poderia haver outros motivos também.
Dito isto, se você quiser saber o que você realmente tem que olhar para o monitoramento de desempenho no próprio nível de SAN e você terá que obter isso de seu pessoal de SAN. O problema pode estar nos discos no LUN (talvez um disco tenha falhado e uma reconstrução RAID esteja ocorrendo, possivelmente o cache está desabilitado por algum motivo, talvez outros LUNs distribuídos nos mesmos discos tenham prioridade mais alta e estejam ocupados), possivelmente o cache está desativado \ falhou nessa matriz específica, talvez a estrutura da SAN ou os comutadores estejam com problemas.
Há um artigo antigo e muito bom sobre Contadores de disco no Windows aqui .