O que é um sinalizador para baixar arquivos ocultos pelo wget?

2

Eu fiz o download de um grande diretório (com subdiretórios) de http por wget , mas arquivos ocultos ( .filename ) ficaram de fora.

Como posso fazer o download?

EDITADO para @dhag

Eu usei o comando: wget --mirror --no-parent https://.../directory --user=... --password=...

Eu não sei responder a sua segunda pergunta, mas posso baixar o arquivo oculto desta forma wget --mirror --no-parent https://.../directory/.hidden_file_name --user=... --password=... , mas o caminho é muito ineficiente.

    
por torm 16.12.2015 / 20:05

1 resposta

0

O comentário de Dhag está correto. wget baixa a página com url que é passada em sua linha de comando. Bem wget pode receber argumentos assim:

wget -r --no-parent http://host/dir

e o argumento -r significa baixar recursivamente. Mas o download recursivo não significa baixar tudo no diretório dir . Isso significa fazer o download da página com o URL fornecido, encontrar todos os links da página e fazer o download de todas as páginas vinculadas.

Bem, o URL pode levar a um diretório no servidor. Mas o servidor http, em seguida, fornece uma página html contendo links para cada arquivo (se a listagem de diretórios for permitida). A página contém algo como

<a href="filename1">filename1</a><p>
<a href="filename2">filename2</a>

A página html pode conter outras informações, como tamanhos de arquivo, tipos de arquivo, proprietários e assim por diante. Mas todas as informações são geradas no lado do servidor e os clientes, como o wget, podem apenas analisar as informações fornecidas pelo servidor e seguir links listados na página com essa 'listagem de diretórios'.

Portanto, se um arquivo estiver oculto e não estiver listado na listagem de diretórios, será uma decisão do servidor e você não poderá forçar o servidor a fornecer mais informações por meio de um parâmetro wget.

No entanto, você não está sem sorte. A maioria do servidor http pode ser configurada e o administrador pode decidir quais arquivos estão ocultos. Por exemplo, o servidor apache tem uma opção de configuração IndexIgnore e contém padrões de arquivo que devem estar ocultos.

    
por 16.12.2015 / 21:11

Tags