Excluindo algumas páginas php mas não outras com wget?

0

Eu quero usar wget para fazer download recursivamente de um website. O site contém artigos servidos por um script php, por exemplo. www.example.com/article.php?id=1021&ch=5 - estes são o que eu quero, todos os artigos separados com todos os capítulos.

Infelizmente, o site também contém comentários - muitos e muitos comentários. Comentários também são servidos por um script php, por exemplo. www.example.com/comment.php?id=1021&no=144 - estes eu não quero querer .

Basicamente, quero tudo exceto os comentários. O problema é que os links para artigos, capítulos e comentários são intercalados nas listas de artigos e capítulos, portanto não há como "ajustar" o nível de recursão para evitá-los ... e fazer o nível para o nível e ordenar manualmente entre cada um, levaria muito tempo e esforço.

Como ambos são php-scripts, usar as opções -A ou -R de wget para aceitar ou rejeitar arquivos com um determinado sufixo não funcionará - ou não? Existe alguma outra maneira mais precisa para excluir um script php, mas não outros, ao fazer o download recursivamente?

    
por Baard Kopperud 22.12.2014 / 17:33

1 resposta

2

O texto a seguir fornecerá algumas informações sobre o que você está procurando: link

Você deve poder usar --exclude /comment.php para excluir todas as variações da página comment.php

    
por 22.12.2014 / 20:40

Tags