Como encontrar as páginas que ligam a uma página específica?

1

Eu tenho a seguinte página

link

Gostaria de encontrar as páginas em www.fda.gov com links para esta página? Como posso fazer isso?

    
por Norfeldt 20.08.2016 / 17:43

1 resposta

2

  1. Você pode usar wget para baixar recursivamente o site inteiro:

    wget --recursive --page-requisites --html-extension --no-parent --domains www.fda.gov www.fda.gov

  2. Você pode então usar o egrep para pesquisar recursivamente todos os arquivos e descobrir quais páginas estão vinculadas a ucm092156.pdf:

    egrep -r -o '*ucm092156.pdf' www.fda.gov/

por 20.08.2016 / 18:03