O desempenho é drasticamente pior porque a escrita síncrona força a computação de paridade para martelar os discos.
Em geral, a paridade de computação e escrita é um processo relativamente lento, especialmente com o RAID 6 - no seu caso, o md tem que fragmentar os dados em quatro blocos e depois calcular dois fragmentos de paridade para cada faixa. Para melhorar o desempenho, as implementações RAID (incluindo md) armazenarão faixas recentemente usadas na memória para comparar os dados a serem gravados com os dados existentes e recompilar rapidamente a paridade na gravação. Se novos dados forem gravados em uma faixa em cache, ela poderá comparar, fragmentar e recompilar a paridade sem nunca tocar no disco e, em seguida, liberá-lo posteriormente. Você criou uma situação em que o md sempre erra o cache. Nesse caso, ele precisa ler a faixa do disco, comparar os dados, fragmentar os novos dados, recalcular a paridade e, em seguida, liberar a nova faixa diretamente no disco. O que exigiria zero leituras e gravações de / para disco em uma ocorrência de cache se torna seis leituras e seis gravações para cada faixa gravada.
Com certeza, a diferença de desempenho que você observou é enorme (1,9 GB / s contra 449KB / s), mas acho que tudo é contabilizado em quanto trabalho a MD está fazendo para manter a integridade dos dados.
Esse acerto de desempenho pode ser agravado pela maneira como você tem os discos organizados ... se você tiver todos eles em um controlador, muito mais leitura e escrita farão com que o desempenho fique parado.