A resposta curta é que o seu sistema de disco está lamentavelmente insuficiente para o que você está tentando fazer.
1 MB / seg é bastante típico do desempenho de E / S aleatório no RAID1 em discos SATA. EXEMPLO: veja a calculadora de invasão de iops anr do wmarow aqui . Colocando dois discos Barracuda ES.2 SATA em um RAID10 (efetivamente o mesmo que um RAID1), definir 100% de gravações com 0% de cache de gravação mostra uma estimativa de 0,57 MB / s de taxa de transferência. O desempenho no mundo real pode ser diferente, mas não será muito diferente.
O fato de você identificar o kdmflush como o processo responsável do kernel reforça isso - se o seu sistema de disco não for capaz de lidar com a carga, isso resultará em mais tempo gasto em iowait neste processo. O kdmflush é o processo de liberação do device-mapper, que lida com o trabalho adiado devido ao carregamento em outro lugar.
Existem algumas maneiras de melhorar isso - obtenha mais discos, obtenha discos melhores ou ative o cache de gravação no controlador.
Se você ativar o cache de gravação, também desejará obter uma BBU. A BBU pode não ser uma opção para o SAS1068E onboard, então você pode ter que obter um controlador PCI-e.
Eu vi um desempenho abismal com o DRBD quando os controladores RAID que eu estava usando (3ware 9550, eu acredito) não tinham o cache de gravação ativado. Seu carregamento de DRBD será principalmente IO aleatório, portanto, o cache de gravação terá um efeito significativo no desempenho.
O SAS1068E é muito baixo e também pode estar contribuindo para o problema. Se você tiver mais discos ou discos melhores, sugiro que você obtenha um controle melhor também.
Uma busca rápida no google revela um desempenho similarmente ruim com o mesmo controlador RAID de modelo que você está usando.