txt file e linebreaks

1

eu usei

antiword > filename.txt

Para converter um documento do Word .doc em um arquivo txt. Depois editei o arquivo em nano (também tentei vim) e quando o documento é visualizado em libre office e gvim ou até mesmo em edição de texto as quebras de linha estão no lugar errado. O bit que era originalmente um .doc manteve as quebras de linha corretas, mas o bit que adicionei não o fez. Ele é exibido corretamente nos editores do terminal, mas não na GUI

Um link para um exemplo:

B foi escrito em libre office C foi escrito em nano.

link

Por que isso acontece? Existe uma maneira de consertar isso?

    
por JGreen 20.04.2013 / 16:19

1 resposta

3

Você confundiu quebra de linha para quebras de linha .

Compare:

Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.

para

% bl0ck_qu0te%

O primeiro texto não é palavra-embrulhado enquanto o segundo é empacotado para se tornar mais legível. No código-fonte dessa resposta, você pode ver o mesmo texto. Para que o texto apareça com quebras de linha consistentes, forneça as quebras de linha (por exemplo, pressione Enter

vim quebra automaticamente as linhas se você tiver textwidth (taquigrafia: tw ) definido (no modo normal, digite :set tw=80 seguido por Enter

para ter no máximo 80 caracteres em uma linha.). No seu texto existente, você pode digitar gg para ir para o início do documento seguido por gqG para passar da posição atual até o final.

Eu usei uma abordagem alternativa, o texto foi salvo em um arquivo foo.txt e eu executei o fold -s foo.txt > foo-new.txt para obter o texto abaixo:

Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor 
incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis 
nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. 
Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu 
fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in 
culpa qui officia deserunt mollit anim id est laborum.

Para mais informações sobre as ferramentas que usei:

  • configuração da largura de texto do vim: vim +h\ tw
  • "Quebra de cada linha de entrada para caber na largura especificada": man fold
por Lekensteyn 20.04.2013 / 18:44