Como faço uma lista de todos os links em uma página da web (DownThemAll!)?

4

Como posso baixar os links (não o conteúdo das páginas para as quais os links apontam, apenas os próprios links. Estou tentando dar uma lista de cerca de 300 vídeos para o administrador da rede desbloquear, ele só quer URLs.

    
por wizlog 13.09.2011 / 04:08

2 respostas

3

No PHP:

<?php

$webpagehtml=file_get_contents("http://www.example.com");

$dom=new DOMDocument();
$dom->loadHTML($webpagehtml);

$xpath=new DOMXPath($dom);
$items = $xpath->query("//a");

$links=array();

for ($i = 0;  $i < $items->length; $i++ ) {
$item = $items->item($i);
$title=$item->textContent;
$href=$item->getAttribute('href');

if($href && $title){
echo "$href = $title<br/>";
}
}
?>

Em Python, use o link .

Ou você pode usar o downthemall no firefox para fazer o trabalho sujo.

    
por 13.09.2011 / 04:54
2

Quando eu quero ver os links em uma página da web, eu pego uma cópia antiga do navegador Avant (ver 10) dos meus arquivos e a instalo. Execute a página da web que você deseja. Clique com o botão direito do mouse na página e selecione "Abrir todos os links nesta página". Você não pode recortá-los e colá-los.

    
por 25.09.2012 / 06:05