Como eu uso wget ou CURL em php para capturar um instantâneo de uma página da web com um asterisco * em sua URL? (Pergunta de Wayback Machine archive.org)

1

A seguinte página da Web na Wayback Machine (archive.org) tem um asterisco * em seu URL: link * / link

Nem o CURL nem o wget permitirão que eu pegue a página. Eu estou usando a versão mais recente do Linux Mint (2018).

Como faço para usar wget ou CURL em php para capturar um instantâneo de uma página da web com um asterisco * em seu URL, especificamente link * / link ?

Obrigado! Pode o trabalho do httrack?

EDIT: Abra o site web.archive.org/web/%2A/ link em um navegador. Em seguida, compare com o que você vê com o comando wget. Eles são os mesmos? Para mim, o comando wget apenas retorna uma página genérica.

    
por gamedesigner 05.02.2018 / 21:39

1 resposta

0

Parece funcionar bem para mim, desde que a URL esteja entre aspas.

Se você quiser evitar a mensagem "Aviso: caracteres curinga não suportados no HTTP", o mais fácil é substituir o asterisco por seu equivalente codificado por percentual :

wget "https://web.archive.org/web/%2A/https://www.nasa.gov"
    
por 05.02.2018 / 22:16