Você está usando uma única nova linha para quebra automática e duplas novas linhas para parágrafos. O Word reconhece uma ou mais novas linhas como um novo parágrafo, que se torna um novo ponto. Você precisa introduzir uma etapa extra de manipulação antes de colar no Word, onde novas linhas únicas são removidas.
Se você pode usar expressões regulares, é simples substituir \r\n(?!\r\n)
por nada. Isso remove novas linhas (da variedade CR+LF
) se elas não forem seguidas por outra nova linha, removendo, portanto, quebras de linha únicas. 1
Tem o efeito colateral de reduzir várias linhas novas em um. 2 Você pode fazer isso com muitos editores de texto avançados; praticamente qualquer coisa que suporte expressões regulares compatíveis com Perl (PCRE).
Por exemplo, no Notepad ++:
Clique para aumentar o tamanho
Para arrumar as coisas, você pode substituir vários espaços por um único espaço, substituindo [ ]+
(um ou mais espaços) por (um único espaço).
1 \r
significa retorno de carro ( CR
), \n
significa avanço de linha ( LF
). O Windows usa CR+LF
para novas linhas, o Linux usa apenas LF
. (?!something)
denota um lookahead negativo em PCRE; isto é, corresponde apenas se something
não aparecer. Além disso, o lookahead não é incluído na partida e, portanto, não é substituído, é apenas verificado .
2 (?<!\r\n)\r\n(?!\r\n)
não será igual / reduzido se houver mais de uma linha. Usa o lookbehind negativo, (?<!something)
.