-A
, -B
, -C
funcionam corretamente e curtem com o GNU grep
com o pdfgrep 2.0 para mim.
Você sempre pode usar (assumindo o GNU grep
):
pdftotext file.pdf - | grep -A/B/C...
(que no meu caso também parece ser muito mais rápido, embora ambos usem poppler
).
Ou para trabalhar com mais de um arquivo, faça como zgrep
:
for file in ./*.pdf; do
pdftotext "$file" - | grep --label="$file" -H ...
done
(adicionar a opção -layout
a pdftotext
parece dar um resultado mais próximo ao de pdfgrep
. Você também pode querer espremer sequências de caracteres de espaçamento em um espaço para ajudar nas pesquisas de sequências de várias palavras canalizando a saída de pdftotext
a tr -s '[[:space:]]' '[ *]'
)