-
Você pode usar
wget
para baixar recursivamente o site inteiro:wget --recursive --page-requisites --html-extension --no-parent --domains www.fda.gov www.fda.gov
-
Você pode então usar o
egrep
para pesquisar recursivamente todos os arquivos e descobrir quais páginas estão vinculadas a ucm092156.pdf:egrep -r -o '*ucm092156.pdf' www.fda.gov/