Uso avançado do pdfgrep

0

Preciso de ajuda para resolver uma situação. Parece bem simples, mas não é o que eu acho.

#!/bin/bash

pdfgrep -Hn $1 *.pdf

exit 0

Se eu executar este código em qualquer diretório que contenha arquivos PDF ocr'd, ele irá mostrar "arquivo correspondente + número de página no arquivo + linha correspondente para o padrão $ 1".

Agora, para o problema. Digamos que eu queira fazer a mesma coisa com 2 padrões "$ 1" e "$ 2". Não será tão fácil quanto

pdfgrep -Hn $1 | pdfgrep -Hn $2 *.pdf

Como isso pode ser feito, para que o resultado seja "correspondência de arquivo + número de página no arquivo que contém os dois padrões $ 1 e $ 2"?

Qualquer ajuda apreciada: -)

Obrigado!

/ Paul

    
por Paul Bergström 08.09.2016 / 16:32

1 resposta

0

Eu encontrei uma solução de trabalho bastante simples:

#!/bin/bash

pdfgrep -Hn $1 *.pdf | cut -f1,2 -d':' > /tmp/sok1.tmp
pdfgrep -Hn $2 *.pdf | cut -f1,2 -d':' > /tmp/sok2.tmp
comm -1 -2 --nocheck-order /tmp/sok1.tmp /tmp/sok2.tmp

exit 0

/ Paul

    
por 09.09.2016 / 11:00

Tags