No PHP:
<?php
$webpagehtml=file_get_contents("http://www.example.com");
$dom=new DOMDocument();
$dom->loadHTML($webpagehtml);
$xpath=new DOMXPath($dom);
$items = $xpath->query("//a");
$links=array();
for ($i = 0; $i < $items->length; $i++ ) {
$item = $items->item($i);
$title=$item->textContent;
$href=$item->getAttribute('href');
if($href && $title){
echo "$href = $title<br/>";
}
}
?>
Em Python, use o link .
Ou você pode usar o downthemall no firefox para fazer o trabalho sujo.