Eu estava enfrentando o mesmo problema que você: Eu tinha vários arquivos .pdf
(duas páginas cada) que eu queria transformar em algo que eu poderia importar para um arquivo do Word; algo simplesmente foi um .emf
no final (todos os outros formatos não foram aceitos).
Esta resposta pressupõe que você está confortável em usar o console.
A ferramenta escolhida para converter o formato vetorial X em formato vetorial Y parece ser inkscape
. No entanto, ao importar um arquivo .pdf
diretamente para inkscape
- você só pode acessar a primeira página no console (pelo que eu sei)
- mesmo se você selecionar a opção de texto para caminhos, sinalizador
-T
, o texto não será bem transformado.
Portanto, achei necessário pré-converter o arquivo .pdf
em algo que inkscape
é capaz de usar. Eu encontrei esta resposta muito útil, especialmente a menção de pdf2svg
. Minha sequência final foi a seguinte:
pdf2svg input_filename.pdf interim_filename_%d.svg all
inkscape -T interim_filename_1.svg --export-emf=interim_filename_1.emf
(repeat for all additional pages of the .pdf)
Para o melhor do que posso ver na tela, transferindo esses arquivos .emf
para uma máquina Windows e abrindo-os usando o visualizador de imagens do Windows, o resultado é idêntico à entrada. Além disso, tendo tentado um caso de teste com um documento LaTeX personalizado usando uma fonte não presente em minha máquina Windows, também achei o resultado idêntico. Ignorar a etapa pdf2svg
inicial significa que o espaçamento foi completamente confuso após a conversão de inkscape
.
No meu caso, não precisei remover os limites da página .pdf
(eu estava lidando com arquivos de página inteira). Você pode exigir uma etapa intermediária se estiver interessado apenas em uma pequena parte da página .pdf
. Puxando de esta resposta , pdfcrop
parece ser capaz de fazer isso.