Para explicar o que eu quero, vou dar um exemplo (Meus amigos estrangeiros, desculpe, é em árabe, não em inglês: D).
Vamos usar este URL por exemplo. Quando você abre, um quadrado azul aparecerá após um temporizador de 5 segundos. Antes de pressionar este botão azul, se você o inspecionar com seu navegador, você notará que href
para este botão é o mesmo URL seguido por uma consulta ?pt=
, que parece ser algum tipo de token gerado toda vez .
Se você seguir esse URL (pressionando o botão ou copiando / colando o URL), ele direcionará você para uma página e, novamente, inspecionará a página, mais especificamente para um elemento gravado como (تحميل), o href
contém o mesmo URL seguido por uma consulta "download_token", que é gerada sempre que você solicita a página.
Agora você pode obter o URL original com wget
e, com algumas análises, você pode obter o URL interno (aquele com a consulta ?pt=
), mas o URL resultante da análise obterá o URL original, não a página que contém o download_token
wget
e curl
%XX
, que é uma representação hexadecimal de um ASCII. Eu os substituí com os caracteres correspondentes, mas não funcionou. Como fazer com que wget
, curl
ou qualquer outro utilitário semelhante faça o download de uma URL após sua consulta dinâmica? parece que está analisando a URL com ?pt=
de alguma forma errada, talvez devido aos caracteres hexadecimais? O URL com download_token
funciona bem com wget
(pelo menos em algumas tentativas).
Meu objetivo para tudo isso é automatizar o processo semelhante para os demais 1200+ links.