O texto a seguir fornecerá algumas informações sobre o que você está procurando: link
Você deve poder usar --exclude /comment.php
para excluir todas as variações da página comment.php
Eu quero usar wget
para fazer download recursivamente de um website. O site contém artigos servidos por um script php, por exemplo. www.example.com/article.php?id=1021&ch=5 - estes são o que eu quero, todos os artigos separados com todos os capítulos.
Infelizmente, o site também contém comentários - muitos e muitos comentários. Comentários também são servidos por um script php, por exemplo. www.example.com/comment.php?id=1021&no=144 - estes eu não quero querer .
Basicamente, quero tudo exceto os comentários. O problema é que os links para artigos, capítulos e comentários são intercalados nas listas de artigos e capítulos, portanto não há como "ajustar" o nível de recursão para evitá-los ... e fazer o nível para o nível e ordenar manualmente entre cada um, levaria muito tempo e esforço.
Como ambos são php-scripts, usar as opções -A ou -R de wget para aceitar ou rejeitar arquivos com um determinado sufixo não funcionará - ou não? Existe alguma outra maneira mais precisa para excluir um script php, mas não outros, ao fazer o download recursivamente?
O texto a seguir fornecerá algumas informações sobre o que você está procurando: link
Você deve poder usar --exclude /comment.php
para excluir todas as variações da página comment.php