A maneira mais fácil: faça o login com seu navegador e forneça os cookies para wget
Método mais fácil: em geral, você precisa fornecer wget ou curl com os cookies (logados) de um site específico para que eles possam buscar as páginas como se você estivesse logado .
Se você estiver usando o Firefox, é fácil fazer isso por meio dos Exportar cookies add-on. Instale o complemento e:
- Vá para Ferramentas ... Exportar cookies e salve o arquivo
cookies.txt
(você pode alterar o nome do arquivo / destino). -
Abra um terminal e use
wget
com a opção--load-cookies=FILENAME
, por exemplowget --load-cookies=cookies.txt http://en.wikipedia.org/wiki/User:A
- Para curl , é
curl --cookie cookies.txt ...
- Para curl , é
(Tentarei atualizar esta resposta para usuários do Chrome / Chromium)
Da maneira mais difícil: use curl (de preferência) ou wget para gerenciar toda a sessão
- Um tutorial detalhado está além do escopo desta resposta, mas você usa o curl com o
--cookie-jar
ou wget com as opções--save-cookies --keep-session-cookies
, junto com o método HTTP / S PUT para efetuar login em um site, salvar os cookies de login e usá-los para simular um navegador. - Escusado será dizer que isso requer passar pelo código-fonte HTML da página de login (obter nomes de campos de entrada, etc.) e muitas vezes é difícil trabalhar em sites que usam qualquer coisa além da autenticação simples de login / senha.
- Dica: se você seguir esse caminho, geralmente é muito mais simples lidar com a versão móvel de um site (se disponível), pelo menos para a etapa de autenticação.