Existe uma maneira comum de renderizar arquivos pdf em um formato legível por humanos na linha de comando e manter o layout geral?

1

Estou imaginando algo mais profundo do que pdftotext (parte do poppler-utils ), porque o que eu era imagem seria possível, seria manter a maior parte do layout em uma página virtual, por exemplo canalize isto através de um pager como mais , e então possivelmente até mesmo obtenha substituições baseadas em símbolos de gráficos simples e tal.

Uma cadeia de comandos que você usa normalmente, ou um script, seria realmente interessante de ver.

Adicionei a palavra "comum" à pergunta, para evitar fazer uma pergunta que exija muita opinião, o que é contra o etimo do Stack Exchange.

Uma grande prioridade aqui seria se a solução fosse totalmente portátil, por exemplo, para usar mesmo no modo de usuário único em um Mac, por exemplo.

    
por forgotstackxpassword 23.03.2016 / 01:49

1 resposta

0

pdftotext tem uma opção -layout :

   -layout
          Maintain  (as  best  as  possible) the original physical
          layout of the text.  The default is to  ´undo'  physical
          layout  (columns, hyphenation, etc.) and output the text
          in reading order.

Não faz gráficos, no entanto.

    
por 16.04.2018 / 03:25