Esta edição simples do primeiro comando resolve o problema.
wget --recursive -nd --no-parent --level 10 --accept "*.raw" --execute robots=off https://cptc-xfer.uis.georgetown.edu/publicData/Phase_II_Data/TCGA_Ovarian_Cancer_S_026/
Estou atualmente tentando baixar dados do servidor https usando o wget. Existem muitas subpastas e arquivos, mas apenas uma extensão de arquivo (* .raw) é interessante para mim. (Pastas pai não são desejadas)
Este comando foi tentado:
wget --recursive --no-directories --no-parent --level 10 --accept "raw" --execute robots=off https://cptc-xfer.uis.georgetown.edu/publicData/Phase_II_Data/TCGA_Ovarian_Cancer_S_026/
e
wget --mirror --convert-links --adjust-extension --page-requisites --no-parent https://cptc-xfer.uis.georgetown.edu/publicData/Phase_II_Data/TCGA_Ovarian_Cancer_S_026/
No entanto, inserir o mesmo comando com um dos diretórios contendo arquivos de interesse está funcionando (mas não desejado, como deve ser feito manualmente)
wget --recursive --no-directories --no-parent --level 10 --accept .raw --execute robots=off https://cptc-xfer.uis.georgetown.edu/publicData/Phase_II_Data/TCGA_Ovarian_Cancer_S_026/TCGA_09-1664-01A_61-2094-01A_25-1312-01A_Proteome_JHUZ_20130802/TCGA_09-1664-01A_61-2094-01A_25-1312-01A_Proteome_JHUZ_20130802_raw/
Alguma ideia de como formular o comando para obter os arquivos? Obrigado antecipadamente Vivian
Esta edição simples do primeiro comando resolve o problema.
wget --recursive -nd --no-parent --level 10 --accept "*.raw" --execute robots=off https://cptc-xfer.uis.georgetown.edu/publicData/Phase_II_Data/TCGA_Ovarian_Cancer_S_026/