Como converter arquivo pdf para um arquivo odt?

29

Eu quero converter um arquivo .pdf em um arquivo .odt para que eu possa convertê-lo ainda mais em um arquivo .doc . Existe algum software / script que pode fazer isso. Eu tentei copiar o conteúdo do arquivo .pdf e colei no escritor liberoffice a formatação não é preservada.

O documento é confidencial, então prefiro não usar nenhum serviço on-line para a conversão.

Qualquer ajuda é muito apreciada.

    
por Ankit 11.01.2013 / 18:09

5 respostas

14

Eu estava chateado com a falta de um conversor PDF para ODT gratuito também. Eu nem precisei de nada complicado. Apenas uma ferramenta que gera arquivos ODT que eu posso anotar no LibreOffice (por exemplo, para preencher formulários).

Eu sei como fazer isso manualmente, convertendo o documento PDF em arquivos gráficos e importando-os para o LibreOffice, mas isso é entediante muito rápido.

Então, finalmente escrevi um pequeno script de shell que faz todas as etapas necessárias automaticamente. Você pode encontrá-lo em link

Ele pode receber qualquer número de arquivos PDF e de imagem como entrada e gera um arquivo ODT que pode ser aberto e editado no LibreOffice. As imagens aparecem como fundo da página, para que você possa escrevê-las livremente. Cada imagem está associada ao seu próprio estilo de página. Tenha isso em mente ao inserir quebras de página e ajustar o estilo da página conforme necessário.

Eu testei o script no Linux e no Mac. Dado que só precisa de um punhado de ferramentas razoavelmente padrão, deve ser bastante portátil.

    
por gutschke 14.04.2014 / 01:05
12

Você pode dar uma olhada em PDF Utilities (poppler-utils via Synaptic ou apt-get) que inclui pdftotext :

Poppler is a PDF rendering library based on Xpdf PDF viewer.

This package contains command line utilities (based on Poppler) for getting information of PDF documents, convert them to other formats, or manipulate them:
* pdfdetach -- lists or extracts embedded files (attachments)
* pdffonts -- font analyzer
* pdfimages -- image extractor
* pdfinfo -- document information
* pdfseparate -- page extraction tool
* pdftocairo -- PDF to PNG/JPEG/PDF/PS/EPS/SVG converter using Cairo
* pdftohtml -- PDF to HTML converter
* pdftoppm -- PDF to PPM/PNG/JPEG image converter
* pdftops -- PDF to PostScript (PS) converter
* pdftotext -- text extraction
* pdfunite -- document merging tool

É claro que o sucesso dependerá de como o arquivo PDF foi gerado. Se você obtiver o que deseja como arquivo de texto, poderá salvar como um arquivo. arquivo odt.

Editar: Esqueci de fornecer a fonte para a cotação. É a partir da guia de descrição no Synaptic para PDF Utilities (based on Poppler).

    
por user25656 11.01.2013 / 19:41
9

O LibreOffice é capaz de importar arquivos .pdf . Basta abri-lo em uma versão atual do LibreOffice para obter melhores resultados. No entanto, ele abrirá o documento como um desenho, e você poderá convertê-lo apenas em um dos formatos de imagem suportados, não como um documento do Writer.

Naturalmente, nem todas as formatações são preservadas, mas pelo menos algumas.

    
por bender 11.01.2013 / 19:10
3

Se o pacote poppler-utils estiver instalado, o script Nautilus abaixo (para ser colocado na pasta ~ / .gnome2 / nautilus-scripts como um arquivo executável) será ajuda a converter arquivos PDF em HTML (a opção "-i" também pode ser excluída para incluir imagens), que pode ser aberta com o LibreOffice Writer e salva como ODT embora o sucesso da conversão de formatação dependa muito sobre como o PDF é criado.

link

    
por Sadi 11.01.2013 / 21:36
1

Experimente o Caliber. Ele converte em html e depois em outros formatos. Ele fez um bom trabalho em um arquivo grande (183 páginas) que eu teria de imprimir.

No meu caso, converti-o em epub, mas por diversão, acabei de convertê-lo em um .docx que resultou muito bem.

    
por Christopher 21.10.2015 / 19:51