Eu tenho um problema comum de pesquisadores. Eu deveria anotar um manuscrito (no Linux, já que é tudo que tenho), ou seja, destacar texto e adicionar comentários para a versão revisada. De acordo com o representante do editor, o arquivo PDF pode ser anotado, por isso deve conter texto (verifiquei isso novamente). O manuscrito foi originalmente produzido com o LaTeX, mas não sei o que o editor fez na composição.
Eu tentei usar o Okular 1.3.3 (no Kubuntu 18.04), mas sem sucesso. O realce do texto não pode selecionar texto, mas destaca grandes áreas de forma arbitrária. Eu também tentei o Acroread para Linux e Evince, mas em vão.
O problema não pode estar no Okular, pois com alguns outros PDFs (gerados a partir de arquivos LaTeX) os trabalhos de destaque, incluindo expressões matemáticas. No entanto, eu tenho uma pista: a seleção de texto funciona de alguma forma em partes do PDF (ou seja, algumas palavras podem ser selecionadas), mas o principal problema parece ser marca d'água diagonal "Revised proof" que cruza a página. Se a área de seleção tocar a marca d'água, ela não poderá mais encontrar texto. Também é possível que equações matemáticas confundam a seleção de texto. O Evince parece ser um pouco melhor que o Okular na seleção de texto do PDF, mas ele não pode fazer anotações (o novo Evince não funciona totalmente no meu Kubuntu).
Eu também notei com a Acroread que não é permitido fazer comentários no PDF (e não sei como alterar essa configuração com o Acroread gratuito - o representante afirma que o comentário dos editores é permitido). Poderia ter algum efeito?
Eu também tentei pdftotext
apenas para ver que ele pode produzir texto, então o PDF realmente contém texto.
Você agora tem alguma solução de como destacar? Como rastrear o que há de errado com o PDF?
Tags pdf okular highlighting