Você pode fazer o último usando o OpenOffice a partir da linha de comando. Há também pontes para linguagens de script - saiba mais no site do OpenOffice. Existe um para PHP chamado PUNO , no entanto eu não tenho experiência pessoal com ele ainda.
Eu preciso converter PDF ou HTML + CSS em DOC ou DOCX no Linux, pode ser a partir da linha de comando ou com uma linguagem de script.
Alguma ideia?
Você pode fazer o último usando o OpenOffice a partir da linha de comando. Há também pontes para linguagens de script - saiba mais no site do OpenOffice. Existe um para PHP chamado PUNO , no entanto eu não tenho experiência pessoal com ele ainda.
Você pode converter HTML em .doc usando uma macro do OpenOffice, veja este tópico:
link
Converter pdf para .doc é muito mais difícil, devido à multiplicidade de conteúdo diferente que pode estar dentro de um PDF - com bastante frequência, os PDFs são usados para coisas como texto digitalizado.
Você pode usar pdftohtml
para criar um arquivo html em um pdf.
O Word pode abrir arquivos html diretamente.
Acabei de me deparar com esta questão e depois de pesquisar um pouco mais, encontrei o pandoc: link
Um comando simples criará um arquivo docx ou pdf (ou rtf etc) da entrada html da seguinte forma:
pandoc -o output.docx input.html
Ele também pode gravar em stdout (com alguns formatos) e ler em stdin.
Não tenho certeza se está nos repositórios debian / ubuntu, mas está no repositório epel 6 para Redhat / CentOS 6 ( yum install pandoc
).
Espero que isso ajude alguém:)
Document Conversion
Current list of past examples.
Convert any document type into PDF
How convert Powerpoint slides to jpeg using openoffice api? (slide splitter)
List of many past conversion examples
Filter list
List of converters available in OOo 2.0 (1.9.x)? Instructions to produce filter list
Recursive Folder of Html into PDF,Txt,SXW,DOC
Recursive Folder of SXD to SDC (StarCalc 5)
Setting Image size for JPEG export
Xcel to Calc conversion using the API
A very similar one, converting Xcel to Text
Batch mode conversion
Document conversion
VB: converting Excel files to txt files
General Visual Basic document conversion of Text...
Converting Word -> PDF from the command line http://www.oooforum.org/forum/viewtopic.php?t=3772 http://www.oooforum.org/forum/viewtopic.php?t=5513 http://www.oooforum.org/forum/viewtopic.php?t=3768
PyOpenOffice tool to convert SXW to PDF without using OOo
Convert Word --> Writer from the command line
Convert Excel -> PDF from the command line
http://www.oooforum.org/forum/viewtopic.php?t=5596 http://www.oooforum.org/forum/viewtopic.php?p=21050#21050
Convert SXC to CSV from commandline
Convert PPT to HTML from command line...
Convert PPT to HTML short example...
Convert PPT to PDF short example...
see tail end of thread...
Converting SXW -> PDF
Draw export to PDF
In Python...
Thread about converting document to PDF in Java
Convert SXW to DOC with Java
http://www.oooforum.org/forum/viewtopic.phtml?p=81846#81846I wrote a batch document converter
http://www.oooforum.org/forum/viewtopic.php?t=3525 http://www.oooforum.org/forum/viewtopic.php?t=2810 http://www.oooforum.org/forum/viewtopic.php?p=10311#10311 you can get it here
http://www.ooomacros.org/user.php#95532 more discussion of it here...
http://www.oooforum.org/forum/viewtopic.php?t=5708Macro to save in three formats
http://www.oooforum.org/forum/viewtopic.php?t=3612 Macro to save backups with timestamps
http://www.oooforum.org/forum/viewtopic.php?t=7674Open HTML with Writer not Web in order to export
http://www.oooforum.org/forum/viewtopic.php?t=3973 http://www.oooforum.org/forum/viewtopic.php?p=44367#44367
How to convert HTML into OpenOffice File?
http://www.oooforum.org/forum/viewtopic.php?t=11580
Page size pblm when converting HTML to PDF
http://www.oooforum.org/forum/viewtopic.phtml?p=63682#63682Discussion that ends in DocConverter utility.
http://www.oooforum.org/forum/viewtopic.php?t=2668Convert DBF into XLS, SXC, PDF and HTML
http://www.oooforum.org/forum/viewtopic.php?t=5728Good Visual Basic code example...converting documents
http://www.oooforum.org/forum/viewtopic.php?t=7673Draw exporting and printing
http://www.oooforum.org/forum/viewtopic.php?t=3620Using OOo's source code to read / convert / write documents in the formats supported by its filters. http://www.oooforum.org/forum/viewtopic.php?t=5785