Como selecionar e imprimir endereços URL de qualquer arquivo?

0

Gostaria de saber qual comando seria:

  1. selecione todo o URL em um arquivo (isto é, reconheça todos os endereços que começam com http ou www do começo ao fim e separe-os do texto ou de outros dados)

  2. exiba-os em um arquivo .txt.

A idéia é executar próximo um wget -i no arquivo .txt. Eu preciso selecionar corretamente e saída desses URL em um arquivo .txt como wget se esforça para identificar diretamente todos os URLs no arquivo bruto.

    
por ivako 06.01.2017 / 01:14

1 resposta

0

Muito obrigado, segui as instruções no link acima ( 1 ) e funcionou perfeitamente no meu caso (como URL estão entre < href > no arquivo de entrada):

grep -Po '(?<=href=")[^"]*(?=")' INPUT_FILE > OUTPUT_FILE.txt

Pergunta resolvida, obrigado novamente!

    
por 06.01.2017 / 23:36

Tags