Usando sed
para unir somente as linhas divididas
sed ':a
/".*"$/b
N;s/\n/ /;ba' input >> output
leva 6 segundos para um arquivo de 10 MB no meu sistema. Isso seria 10 horas para 60 GB.
bbe
é um pouco mais rápido
bbe -b '/"/:/"/' -o output -e 'y/\n/ /' input
mas ainda leva 4 segundos.
Eu tenho medo de que essas linguagens de script não sejam a ferramenta para ter um bom desempenho em arquivos extremamente grandes. Que tal escrever um pequeno programa em C
?