Agora que eu olho novamente, percebi que você disse que esta era uma chave USB (unidade flash) e não um disco rígido. A memória flash só pode ser apagada em grandes blocos, e setores individuais não podem ser gravados sem apagá-los (e o bloco inteiro em que estão) primeiro. Como o software espera poder gravar onde quer que esteja no disco a qualquer momento, o disco possui uma lógica de conversão para lidar de forma transparente com o apagamento. Como isso é feito tem um efeito dramático no desempenho de gravação. Muitos dispositivos usam um algoritmo para a maior parte do disco que lida com gravações sequenciais muito bem, mas é uma droga em gravações aleatórias. A área perto do início do disco é normalmente usada pelo FAT no sistema de arquivos FAT com o qual eles vêm pré-formatados, e essa área é escrita aleatoriamente com freqüência, então eles usam um algoritmo diferente nessa área que é mais lento em gravações sequenciais, mas não terrível ao acaso escreve.
Assim, agora tenho certeza de que meu palpite inicial que adicionei como comentário foi correto. O que você está vendo quando grava no sistema de arquivos é o desempenho do resto do disco, e quando você desce no zero, você está gravando na área de gordura. Se você procurar o destino dd algumas centenas de mb, ele deve acelerar consideravelmente.