Sua pergunta não é muito clara. O que eu entendo é isso:
- você está recuperando páginas da web de forma recursiva;
- suas páginas contêm links internos;
- seguir esses links leva a uma página não existente e você gostaria de reescrever cada link para adicionar um parâmetro extra à solicitação HTTP.
Eu não acho que você pode fazer isso com o wget. Sugiro usar o LWP . Ele vem com um script chamado lwp-rget
que realiza recuperações recursivas. Há uma linha
my $req = HTTP::Request->new(GET => $url);
Pouco antes dessa linha, adicione algum código para mangle a URL conforme apropriado, algo como
$url->query_form($url->query_form, "show_preview" => "yes");