Converte PDF (que foi gerado com o LaTeX) para o arquivo .tex

4

Eu sei que o problema geral de converter um PDF arbitrário em .tex é impossível ou resultaria em LaTeX inutilizável (expressando tudo como gráficos vetoriais, por exemplo).

Mas se meu PDF foi gerado de um arquivo LaTeX (que eu não tenho mais), existe uma maneira de "fazer engenharia reversa" dele de volta no arquivo de código-fonte?

    
por hsribei 27.06.2010 / 19:16

4 respostas

1

Desculpe, mas não ajudaria (muito) se o arquivo fosse gerado pelo LaTex.

    
por 27.06.2010 / 20:29
1

Você perdeu seu arquivo .tex e gostaria de recriar o pdf, talvez para modificá-lo. Dependendo de quanto tempo seu arquivo é e como "regular" seu arquivo de estilo, você pode tentar recriá-lo manualmente.

Para o texto, você deve poder copiá-lo do arquivo PDF (a menos que você tenha usado um recurso de segurança estranho para desaprová-lo) e colá-lo no Emacs em grandes partes. Usando os comandos fill , você pode lidar com as quebras de página e reconstruir a estrutura de parágrafos moderadamente bem e com facilidade. Você pode então encontrar / substituir caracteres estranhos, como hífens e acentos. Manter o controle de notas de rodapé e legendas colocará algum problema; Eu sugiro colá-los onde eles ocorrem e formatá-los de acordo antes de reconstruir a estrutura do parágrafo.

Para os gráficos, supondo que sejam imagens vetoriais, você pode usar o Illustrator ou o Inkscape para separá-los do arquivo PDF e salvá-los como um tipo de arquivo apropriado que pode ser usado pelo pdflatex. Se eles são jpgs, você está sem sorte, já que a qualidade já estará muito comprometida para que eles sejam úteis. Se eles foram gerados pelo LaTeX usando PSTricks ou algo do tipo ... você está sem sorte também.

Os títulos das seções e subseções devem ser fáceis de identificar e reformatar. Enquanto escrevo isso, a rotulagem e a referência começam a parecer um mundo de dor, mas se você planeja no papel, antes de analisar manualmente o arquivo, ele deve ser possível.

Equações matemáticas, se você tiver algo mais complicado, você não terá problema em reescrevê-lo rapidamente.

Quanto às referências, você terá que recriar o arquivo .bib (supondo que você usou um). Eu recomendaria o download das entradas do BibTeX que você pode encontrar online e preencher o resto manualmente.

No geral, parece um projeto de fim de semana (tedioso). Eu já fiz isso antes e não é tão difícil quanto parece. Então, novamente, foi um documento de 20 páginas e não uma dissertação de doutorado, por isso certifique-se de escolher suas batalhas com sabedoria. Tudo o que posso dizer é Boa sorte .

    
por 04.08.2010 / 06:35
1

Eu coloquei isso aqui para qualquer um que esteja procurando por provas futuras - desculpe não ajuda, a menos que você já tenha feito algo como o seguinte -

Existem pacotes LaTeX para incluir / anexar os arquivos originais (ou quaisquer) no seu PDF produzido.

Eu ia colocar todas as informações aqui, mas como um novo usuário o sistema me disse quando eu terminei de escrever, que eu só poderia fazer dois links, então aqui está a mesma informação (em outra discussão) eu postei em a lista de discussão do TeXworks após esta postagem falhou inicialmente.

link

paul link

    
por 22.07.2011 / 04:34
0

Se o PDF é principalmente texto, você pode executar pdf2text no arquivo para extrair o texto bruto. Mas você ainda teria que inserir manualmente todos os comandos do LaTeX para obter a formatação.

    
por 22.07.2011 / 06:28

Tags