Extraindo o código-fonte usando a linguagem de script

0

Estou tentando extrair o código-fonte de um site. Eu codifico assim no meu arquivo de script:

curl http://www.example.com

E a saída é:

<html> <head><title>301 Moved Permanently</title></head> <body bgcolor="white"> <center><h1>Moved Permanently</h1></center> </body> </html>

Apenas isso! Eu não consigo código inteiro. Mas por que? Devo usar outro comando (se houver algum)?

Eu quero obter o código-fonte do site (quero dizer html) Mas eu vejo apenas algumas linhas ...

    
por codergirrl 19.10.2017 / 18:16

1 resposta

1

Você deve usar a opção -L para "seguir redirecionamentos" conforme descrito aqui e, claro, também no < a href="http://manpages.ubuntu.com/manpages/xenial/man1/curl.1.html"> homem curl

curl -L http://www.example.com

Talvez seja suficiente usar

curl https://www.example.com

como diz aqui que o motivo mais comum para uma resposta 301 é uma migração anterior da página de http para https .

    
por derHugo 19.10.2017 / 18:32