enrola a origem da página a partir de um arquivo de texto contendo URLs

Question

enrola a origem da página a partir de um arquivo de texto contendo URLs

#1 resposta do (1 votos)
#2 resposta do (0 votos)
#3 resposta do (0 votos)

2

Eu tenho um arquivo de texto contendo até 100 URLs. Eu sou capaz de enrolar a fonte da página deles usando:

cat /path/to/url.txt|xargs curl -o /path/to/output.txt

Isso fará o download da origem da página para todos os URLs (como eu posso ver isso acontecendo na linha de comando), mas salvará (em output.txt ) a origem da página para o URL no topo da lista.

Como eu faria para salvar a origem da página para cada URL, seja no mesmo arquivo de texto ou, se necessário, em arquivos de texto individuais?

Obrigado,

url curl cat xargs

por Lewandajo 06.11.2015 / 16:49

3 respostas

Tags url curl cat xargs

É uma boa idéia definir permissões de arquivo para 640 na partição do Windows? Como eu posso instalar o git-svn dado este estranho status do apt-cache?

score 1 · Answer 1

Com o GNU Parallel você pode obter vários URLs em paralelo e não precisa se preocupar com as saídas sendo misturadas:

cat /path/to/url.txt | parallel curl > /path/to/output.txt

score 0 · Answer 2

0

for i in $(cat urls.txt); do curl "$i" >> output.txt; done

por 12.11.2015 / 12:52

score 0 · Answer 3

com uma lista simples de URLs em cada linha, isso deve fazer o trabalho e produzir tudo em um único arquivo:

while read in; do xargs curl -K "$in" >> /path/to/output.txt; done < /path/to/url.txt