Você precisará usar expressões regulares para pesquisar padrões e substituir / reformatar o texto.
Expressões regulares: link
Eu tenho muito texto bíblico parecido com
Gen 1:1 In the beginning God created
the heavens and the earth.
Gen 1:2 The earth was empty, a
formless mass cloaked in darkness. And
the Spirit of God was hovering over
its surface.
Gen 1:3 Then God said, "Let there be
light," and there was light.
Gen 1:4 And God saw that it was good.
Then he separated the light from the
darkness.
Eu quero que cada verso esteja em sua própria linha, sem marcas ^ p e removendo o verso Book-Chapter, como este - Eu tenho Word 2007-Notepad ++ e PsPad para fazer isso - qual seria a melhor maneira de se parecer com isso
In the beginning God created the heavens and the earth.
The earth was empty, a formless mass cloaked in darkness. And the Spirit of-
Then God said, "Let there be light," and there was light.
And God saw that it was good. Then he separated the light from the darkness.-
God called the light "day" and the darkness "night." Together these made up-
Você precisará usar expressões regulares para pesquisar padrões e substituir / reformatar o texto.
Expressões regulares: link
Você pode fazer alguns truques com o notepad ++
Antes de começar, você pode querer fazer um backup do seu arquivo
Você pode formatar as quebras de linha, por exemplo, se você selecionar todo o texto e pressionar Ctrl + j , isso transformará seu texto em uma única linha.
exemplo
entrada:
Gen 1:1 In the beginning God created
the heavens and the earth.
Gen 1:2 The earth was empty, a
formless mass cloaked in darkness. And
the Spirit of God was hovering over
its surface.
saída:
Gen 1:1 In the beginning God created the heavens and the earth. Gen 1:2 The earth was empty, a formless mass cloaked in darkness. And the Spirit of God was hovering over its surface.
Do que você pode quebrar o seu texto no final das frases, abrindo o Search > Substitua ... (tecla de atalho - Ctrl + H ), defina o modo de pesquisa como 'Estendido', para 'Localizar:' Você coloca: '. "e ao 'Substituir por:' você escreve ". \ n ", e pressione substituir tudo
exemplo
entrada:
Gen 1:1 In the beginning God created the heavens and the earth. Gen 1:2 The earth was empty, a formless mass cloaked in darkness. And the Spirit of God was hovering over its surface.
saída:
Gen 1:1 In the beginning God created the heavens and the earth.
Gen 1:2 The earth was empty, a formless mass cloaked in darkness.
And the Spirit of God was hovering over its surface.
Para se livrar da parte 'Gen', tudo o que você precisa fazer é mudar o modo de busca para Regular Expression, em 'Find what:' Você escreve "Gen (...)", e o 'Replace com: 'permanece vazio. Pressione "Substituir tudo" e:
entrada:
Gen 1:1 In the beginning God created the heavens and the earth.
Gen 1:2 The earth was empty, a formless mass cloaked in darkness.
And the Spirit of God was hovering over its surface.
saída:
In the beginning God created the heavens and the earth.
The earth was empty, a formless mass cloaked in darkness.
And the Spirit of God was hovering over its surface.
Eu vivo e respiro essas coisas. Eu escaninho e livros de OCR para MOBI o tempo todo.
O que você quer é simples: na sua ferramenta RegEx favorita (a minha é EditPlus porque posso fazer isso para 200 arquivos em um instante), use o seguinte para iniciar (ignorar o espaço inicial):
Replace: ([a-z])\n([a-z])
With:
Próximo:
Replace: ^([A-Z])([a-z]+) ([0-9]+):([0-9]+)
With:
That is, blank.
Você tem a ideia.