Para o exemplo do Manual de TV : mesmo problema no Adobe Reader 8.1.2 em um Mac, mas não problemas usando o Mac's Preview para copiar ou pesquisar texto. Além disso, enviá-lo para uma conta do Gmail e, em seguida, escolher "Visualizar" e, em seguida, "HTML simples", revela o texto. Mas o Adobe Reader não gosta disso.
Suas propriedades do documento mostram "Encoding: Custom" para as fontes. Outro documento mostra coisas como "Codificação: Ansi" ou "Roman", e não tem problemas nem em Pré-visualização nem o Adobe Reader em um Mac:
No entanto, os Leadtek e Os exemplos de Swann também causam problemas na Pré-visualização em um Mac e no Gmail, e ambos mostram "Codificação: Identidade-H" . O teste Phonedisc também falha, com "Encoding: Custom".
Confuso e não consistente, mas em algum fórum da Adobe Encontrei a seguinte explicação para ainda outro exemplo que mostra" Encoding: Custom "(ênfase minha) :
After looking inside the PDF it turns out that no usable encoding information is present (neither in the PDF nor in the embedded font data) to derive the meaning of the characters/glyphs that are displayed on the pages in the document.
The fonts actualy are all embedded, but in a way that all encoding information has been removed. This is a typical example of a PDF that is syntactically fully compliant with the PDF spec but where important information about the meaning of the text in it has been thrown away during the process of making the PDF. As far as I can tell it would be very difficult to recover the encoding info.
Isso não explica por que a visualização do Mac (e aparentemente Infix também) pode lidar com alguns dos exemplos quando o Adobe Reader falhar, mesmo com "Encoding: Custom". Talvez o Preview não tenha problemas quando a fonte exata estiver presente no próprio computador? Ou talvez seja apenas adivinhar uma codificação, que funciona para alguns, mas não para todos os documentos?
O que quer que cause isso: se passar pelo Google Docs ou pelo Gmail não funcionar, talvez a solução mais fácil (mas longe de ser fácil) seja salvar como TIFF e fazer OCR . Serviços como o Evernote podem fazê-lo em tempo real (ele faz o OCR nas imagens; duvido que ele faça o OCR em um PDF).