Você pode canalizar a saída da ferramenta pdftotext
para o comando grep
:
pdftotext <pdffile> - | grep -Eo '(\b.+) \b'
Para pesquisar uma string predeterminada em arquivos PDF, há também uma ferramenta chamada pdfgrep
. No entanto, não permitirá a expressão regular complexa como no exemplo referenciado.