(Para as soluções abaixo, eu suponho que você queria uma linha em branco para preceder cada cabeçalho + linha de seqüência. Se você quiser depois, me avise, que é uma mudança fácil de fazer.)
Usando sed
$ sed -rn 's/(.{106})/\n/p' file
B2S312_20116609 HWI-ST1128:217:D2HB4ACXX:8:1101:20814:45721 orig_bc=CCGCATAA new_bc=CCGCATAA bc_diffs=0 AACCATGCACCACCTGTATCTGTGTCTAACCAAAGGTCAGAACAACACAATCTCTTGTGTCCTCACAGTATGTCAAGACTT
B4S315_20116610 HWI-ST1128:217:D2HB4ACXX:8:1101:20948:45746 orig_bc=ATATGCCG new_bc=ATATGCCG bc_diffs=0 AACCATGCACCACCTGCACACGACCAACTAAATGCCACCACATCTCTGCAGTGTCGCCGTGCATGTCAAGCCTT
A2C214_20116612 HWI-ST1128:217:D2HB4ACXX:8:1101:21248:45534 orig_bc=CCTAGGAT new_bc=CCTAGGAT bc_diffs=0 AACCGTGCACCACCTGTTTTCTGGCTTCCGAAGAAGAGGAACTATCTCTAGTTCTGTCCATCAATGTCAAGACCT
Como funciona
-
-r
-r
diz a sed
para usar expressões regulares estendidas.
-
-n
-n
indica sed
para não imprimir nenhuma linha, a menos que explicitamente solicitado.
-
s/(.{106})/\n/p
Se qualquer linha tiver pelo menos 106 caracteres, adicionamos uma nova linha ao início e a imprimimos.
Como as linhas em branco não possuem 106 caracteres, elas não são impressas.
Como as linhas sem sequências de DNA são menores que 106 caracteres, elas não são impressas.
Linhas com sequências de DNA (fazendo-as com 106 caracteres ou mais) são impressas. Como as linhas em branco por si só não são impressas, temos que adicionar uma nova linha ao início da linha. Assim, garante que cada registro de DNA é precedido por uma linha em branco.
Não-GNU sed
Se estiver usando o OSX (BSD), tente:
sed -E -n -e 's/(.{106})/\n/p' file
Usando awk
awk '$6 {print "\n"$0}' file
A sequência de DNA é o sexto campo na linha. Assim, para qualquer linha com um sexto campo não vazio, imprimimos essa linha precedida por uma nova linha.