Uma resposta de Olaf Leidinger na lista de discussão da Evince:
Eu acho que esse recurso é mais adequado para editores de documentos, como eles têm mais informações sobre o documento como um visualizador simples e contando palavras é trivial. Pegue um arquivo PDF como um exemplo. O que você vê como texto pode ser algum tipo de forma gráfica de vetor. Mesmo se o texto estiver contido como tal no arquivo PDF, essas palavras que você vê podem ser compostas de vários "desenhar texto na posição (y, x) "- comandos - por exemplo, no caso de umlauts ou fim de linha. Então, uma única palavra pode contar como várias palavras. Portanto, acho que pode ser difícil implementar esse recurso de forma confiável. Dê uma olhada no pdftotext para ver o que quero dizer.