Como pesquisar. links pdf em uma determinada página da web?

0

Eu tenho esta página rss com muitos links para arquivos .pdf.

A coisa é procurar por certas seqüências dentro deles. pdfs, sem a necessidade de abri-los um por um, e fazer a busca por cada um, porque eles são muito!

Alguém sabe como podemos pesquisar nesses PDFs?

Alguma ideia? Qualquer extensão do navegador? Qualquer feed RSS que permita isso?

    
por MEM 30.05.2013 / 14:23

2 respostas

1

Você sempre pode usar o Google.

filetype:pdf site:http://xyz.com/abc <your keyword(s) here> faria o trabalho por você. Você só precisa encontrar o domínio comum nos PDFs. Com isso, quero dizer que, se houver dois PDFs na página localizados no link e link , então você pode usar site:http://xyz.com/abc . Somente site:http://xyz.com funcionaria também, mas traria para você todos os PDFs que encontrar no site.

Então você quer ser específico.

    
por 30.05.2013 / 19:00
0

faça o download dos arquivos primeiro e, em seguida, pesquise

find /path -name '*.pdf' -ls -exec pdftotext {} - \; | grep "your query"

    
por 30.05.2013 / 22:25

Tags