Resposta curta: são os resultados da latência de rede e de uma carga de trabalho em série (conforme você impôs usando direct=1
, sync=1
e iodepth=1
).
Resposta longa: usando direct=1
, sync=1
e iodepth=1
você criou uma carga de trabalho serial, pois novas gravações não podem ser enfileiradas antes que a gravação anterior seja confirmada e confirmada. Em outras palavras, a taxa de envio de gravações depende estritamente da latência da rede. Um simples ping
entre duas máquinas pode muito bem estar no excesso de 0,2 ms, mais ainda quando se usa um protocolo de nível mais alto como o TCP (e o iSCSI em cima dele). Supondo uma latência de rede total de cerca de 0,33ms, você tem um valor máximo de IOPS de cerca de 3.000. Isso é sem considerar outras fontes de latência (es: os próprios discos), portanto, está de acordo com o que você gravou.
Tente isto: execute um primeiro benchmark sem --direct=1 --sync=1
e outro com essas opções em vigor, mas aumentando a iodepth
para 32 solicitações.
Então relate aqui os resultados.