Documentos PDF normais contendo texto Unicode não armazenam o texto como caracteres - mas como referências aos glifos (formas de letra) nas fontes usadas. Quando incorporar fontes em um documento PDF As fontes Unicode também são geralmente convertidas pelo Acrobat em várias fontes menores - portanto, mesmo se você usar apenas uma fonte, essas referências podem ser para glifos em várias fontes menores, não para os glifos na fonte original.
Ao recortar e colar texto Unicode do Acrobat em outro aplicativo, o Acrobat precisa de informações suficientes para reconstruir os caracteres Unicode a partir das formas das letras. Se a fonte usada tiver glifos nomeados de acordo com a Convenção de nomenclatura do Adobe Glyph , o Acrobat poderá analisar esses nomes ( que também são armazenados no documento PDF) e reconstruir o texto Unicode. Infelizmente, existem muitas fontes Unicode, incluindo as fontes padrão do Windows, que não seguem essa convenção - portanto, isso pode não ser possível.
Os arquivosPDF também garantem a tradução confiável do texto para o Unicode - portanto, você deve ser capaz de cortar e colar texto Unicode de um arquivo Tagged PDF .
Portanto, se você quiser evitar esse problema no futuro, ao criar um PDF a partir de um documento que contenha texto Unicode não-latino, sempre gere o arquivo PDF como um PDF marcado e tente usar apenas fontes criadas com glifos nomeados accoring ao Adobe Glyph Naming Convention. Isso garantirá que seus documentos em PDF Unicode sejam pesquisáveis e que o texr possa ser cortado e colado de forma confiável a partir deles.