O que é surpreendente?
1 thread significa comando, espera, leitura, loop. Há um elemento de espera na latência.
Vários threads eliminam isso e permitem que os discos sejam mais otimizados graças ao enfileiramento de vários comandos. Que você obtenha mais IOPS com 3 threads não é surpreendente em tudo.