A resposta curta é que os discos rígidos otimizam a recuperação de dados se houver mais de uma solicitação de E / S pendente, o que geralmente aumenta o rendimento em detrimento da latência.
O NCQ faz isso, reordena os pedidos de IO para otimizar a taxa de transferência.
O SSD: s funciona de maneira diferente dos drives mecânicos, pois eles têm chips flash paralelos para armazenar dados. Ou seja, se você emitir uma solicitação de E / S por vez, a latência (pesquisa + tempo de leitura) decide a IOPS. Mas se você emitir 4 solicitações de uma só vez, o disco ssd poderá recuperá-las de maneira paralela ou otimizada, e poderá obter 4 vezes a taxa de transferência.
Quanto maior a profundidade da fila, maior a possibilidade de otimização do disco, até certo ponto. Como a IOPS é uma função da taxa de transferência, isso aumenta a IOPS em profundidades de fila mais altas.
EDITAR:
A fila verdadeira reside no sistema operacional que está emitindo todas as solicitações. Dito isso, eu conjeturo que o driver do controlador passe uma certa quantidade da fila para o controlador e o disco, para que eles possam trabalhar em suas profundidades de fila otimizadas. O disco deve ter sua própria fila para poder otimizar.