Obtenha várias páginas da pesquisa do Google

0

Estou escrevendo um script para obter alguns dados da pesquisa do Google. Eu usei lynx para a consulta e redirecionei os resultados para um arquivo para análise posterior. O problema é que tudo que eu obtenho é apenas uma página, como posso obter lynx para obter a próxima página / número de páginas?

Eu usei grep e cut para isolar o URL para ser do tipo "www.google.com/search?q= .....", mas quando tento reenviá-lo para o lynx ele não abre o URL na próxima página, apenas mostra o link sem abrir alguma sugestão? TNX

    
por user209892 31.10.2013 / 14:02

1 resposta

0

Acredito que você precisaria percorrer todos os links na parte inferior da página. Os resultados da pesquisa não estão condensados em uma única página.

Você precisaria analisar e fazer o download de cada um dos resultados por si mesmo.

    
por Bruno Pereira 31.10.2013 / 14:23