Faça o download e renomeie automaticamente para o texto do hiperlink todos os arquivos PDF em uma página

0

Eu uso o Chrono Download Manager para fazer o download em massa de todos os arquivos do tipo X em uma determinada página e funciona muito bem.

Estou interessado em baixar muitos arquivos PDF de um site, todos com nomes de arquivos não descritivos. O texto com hiperlink para cada arquivo, no entanto, é perfeitamente descritivo.

Existe alguma maneira razoável de um não codificador fazer o download de todos esses arquivos e renomear automaticamente cada um deles, de modo que o nome do arquivo seja o mesmo que o texto com hiperlink para o download?

Se isso fizer diferença, esta é a página.

Obrigado!

    
por Custom Soundtrack 01.07.2018 / 08:26

1 resposta

0

O seguinte procedimento com aria2 não é totalmente automático. Você tem que copiar e colar manualmente todos os links de download em um arquivo de texto simples. mas aria2 pode baixar e renomear automaticamente de acordo com o arquivo de texto.

Então, como você cria esse arquivo de texto? Primeiro crie um novo arquivo de texto em qualquer editor de texto. Deixe esse nome de arquivo de texto aria2-script.txt ou qualquer nome que você deseja. Coloque os links de download dircet nele. Lembre-se de colocar os links de download direto somente ; caso contrário, aria2 baixe a página da web. Aqui está a sintaxe desse arquivo aria2-script.txt :

http://example-link.com/direct-link/fileA.pdf
  out=fileA.pdf
  checksum=sha-1=sha-goes-here

Você pode pular a parte da soma de verificação. Adicione muitos links como quiser. Lembre-se de colocar DOIS espaços antes de out= e checksum= (e outras opções), caso contrário o aria2 o tomará como um URL. Por exemplo, seu arquivo de texto será:

https://www.csb.gov/assets/Record/Board_Action_Report_-_Notation_Item_2018-57.pdf
  out=Recommendation 2012-03-I-CA-R14, from the Chevron Refinery Fire investigation.pdf

https://www.csb.gov/assets/Record/Board_Action_Report_-_Notation_Item_2018-56.pdf
  out=Recommendation 2012-03-I-CA-R13, from the Chevron Refinery Fire investigation.pdf

Copie os links de download direto clicando com o botão direito do mouse no link do arquivo nessa página da Web. Agora baixe aria2 da página de lançamento do GitHub , abra o prompt de comando nessa pasta e execute o comando:

aria2c.exe --check-certificate=false --dir="Folder" --input-file="aria2-script.txt"

A opção --check-certificate=false é apenas remover a complexidade da certificação. Existem muitas opções para acelerar o processo de download. aria2 irá renomear automaticamente esses arquivos. Lembre-se de colocar o caminho completo do arquivo aria2c.exe e aria2-script.txt . Para mais detalhes, leia esta lista de opções da aria2 e arquivo de entrada daaria2 .

    
por 01.07.2018 / 16:49