Obtendo a contagem de palavras de um documento em pdf no Evince

19

Existe alguma maneira de obter a contagem de palavras de um documento PDF que estou visualizando no Evince, o visualizador de pdf padrão do Ubuntu? Eu sou capaz de converter os documentos em arquivos de texto e obter a contagem de palavras a partir do terminal, mas eu gostaria muito de ser capaz de chegar rapidamente a eles sem ter que usar o terminal. Existe algum plugin que pode fazer isso, ou já está embutido e eu estou sentindo falta dele?

P.S. Eu preferiria não mudar meu visualizador, já que Evince é o visualizador de PDF padrão no Ubuntu, e eu gostaria muito de fazer o máximo possível usando os aplicativos padrão, já que muitos deles, incluindo o Evince, são realmente bons.

    
por Chris Wilson 08.11.2010 / 20:11

4 respostas

10

Uma resposta de Olaf Leidinger na lista de discussão da Evince:

Eu acho que esse recurso é mais adequado para editores de documentos, como eles têm mais informações sobre o documento como um visualizador simples e contando palavras é trivial. Pegue um arquivo PDF como um exemplo. O que você vê como texto pode ser algum tipo de forma gráfica de vetor. Mesmo se o texto estiver contido como tal no arquivo PDF, essas palavras que você vê podem ser compostas de vários "desenhar texto na posição (y, x) "- comandos - por exemplo, no caso de umlauts ou fim de linha. Então, uma única palavra pode contar como várias palavras. Portanto, acho que pode ser difícil implementar esse recurso de forma confiável. Dê uma olhada no pdftotext para ver o que quero dizer.
    
por Chris Wilson 10.11.2010 / 12:22
26

Você pode fazer isso via linha de comando:

pdftotext filename.pdf - | tr -d '.' | wc -w
    
por Sid 08.11.2010 / 20:22
9

Que tal um script rápido que exige zenity e evidencia. Quando chamado sem um argumento, ele lhe dará uma caixa de diálogo para que você possa escolher um arquivo. Quando chamado com um argumento (ou depois da referida caixa de diálogo), ambos abrirão o arquivo no evince e darão a você uma caixa de diálogo com uma contagem de palavras.

Em outras palavras, copie o seguinte em um arquivo de texto, chamado evince-word-count.sh ou algo assim, salve-o em algum lugar do caminho (por exemplo, ~/bin/ ), torne-o executável (com o botão direito do mouse e propriedades do Nautilus ou com chmod +x ~/bin/evince-word-count.sh ),

#!/bin/bash
if [ "$#" -gt "0" ] ; then
    filename=""
else
    filename="$(zenity --file-selection)"
fi
evince "$filename" &
zenity --info --text "This PDF has $(pdftotext "$filename" - | tr -d '.' | wc -w) words"
exit 0

Agora, clique com o botão direito do mouse em alguns PDFs do nautilus, escolha "Abrir com ..." e abra-o com evince-word-count.sh. Agora, quando você abrir um PDF, ambos serão abertos no evince e fornecerão uma contagem de palavras.

    
por frabjous 08.11.2010 / 23:14
4

Eu não acredito que isso seja possível (bem, é tecnicamente possível, mas não foi implementado).

Você tem que lembrar que o Evince é um documento visualizador e uma contagem de palavras é um recurso normalmente requerido em um editor (sim, eu sei que nem sempre é o caso) ).

Você pode entrar em contato com os desenvolvedores do Evince e perguntar se eles teriam algum interesse em implementar esse recurso.

    
por 8128 08.11.2010 / 20:16

Tags