Resposta rápida:
pdftotext myfile.pdf - | wc -w
Longa resposta:
Se no Unix, você pode usar pdftotext
:
e, em seguida, faça a contagem de palavras no arquivo gerado. Se no Unix, você pode usar:
wc -w converted-pdf.txt
para obter a contagem de palavras.
Além disso, veja o comentário de frabjous - basicamente, você pode fazer isso em uma única etapa canalizando stdout
para um arquivo temporário:
pdftotext myfile.pdf - | wc -w