Uma unidade SATA de 7200 RPM não consegue fazer uma latência de 4,12 ms, o que permitiria fazer 1 / 4,12ms (aproximadamente 240) IOs por segundo, o que não é realista.
A fórmula adequada para calcular IOPS para um único disco é 1 / (avg_seek_time + avg_rotational_latency), que para unidades de 7200 RPM é igual a aproximadamente 75 IOPS. Se você tem uma folha de especificações para o disco, então você teria duas latências, pois as unidades podem absorver gravações e leituras com diferentes latências, mas elas estão dentro de + -10%.
Você pode esperar uma latência de 13-15ms por IO de um disco SATA enquanto a profundidade da sua fila não é muito alta. Tudo entre 10 e 15ms seria considerado OK; 20ms sugeriria problemas de latência por filas profundas (ou tamanhos muito grandes de solicitações de E / S) e 30ms ou mais apontariam para algo patológico. Teoricamente falando, seu 95º percentil deveria estar abaixo de 15 ms e o sistema se comportaria "normalmente".
Você pode fornecer uma medida do tempo médio de atendimento do host e do convidado enquanto executa sua carga de trabalho de produção? Você pode adquirir esse valor observando a saída de iostat
na coluna "aguardar".
Além disso, eu diria que sua configuração tem a máxima latência de abstração possível - desde que você coloque bastante coisa do sistema de arquivos virtual nos blocos físicos do dispositivo.
Além disso, você pode verificar se o seu HBA tem um BBWC (ou se há caches de gravação de disco ativados) e o sistema de arquivos no hipervisor e dentro do convidado não estão usando barreiras?