Como encontrar todos os sites que combinam com o padrão website.edu/~some_string?

1

É comum que os professores universitários tenham suas próprias páginas da web no domínio da universidade e compartilhem recursos lá. Se o nome de um professor for John Smith, então o site dele pode ser harvard.edu/~jsmith.

Eu quero encontrar todas essas páginas em um determinado site, ou seja, todas as páginas que se parecem com website.edu/~[some_string] - observe o til. O motivo é que estou procurando alguns recursos que sei que estão lá, mas não sei o nome da pessoa que o compartilhou.

Eu já tentei:

  1. Pesquisa do Google. Não é muito eficaz já que encontrei acidentalmente algo que procurava, mas foi através de uma hiperligação noutra página Web neste domínio e a Google não a devolveu quando a procurava - talvez não seja indexada de todo, não tenho a certeza sobre isso.

  2. Usando o site do modificador de pesquisa do Google: "websitename.edu/~", mas não funcionou - eu esperava isso, pois esse modificador só aceita um ponto como separador.

Teoricamente, eu suponho que seria possível tentar acessar todo o website possível do formulário website.edu/~[string] onde [string] é uma seqüência de caracteres e tentar todas as possibilidades até algum limite de caracteres, e salve os links que não retornam uma mensagem de erro. Mas deve haver um jeito mais fácil.

Você tem alguma ideia?

    
por teei 13.10.2016 / 17:19

1 resposta

1

Se você está usando o Google, isso é realmente muito fácil:

site:http://www.cameron.edu/~

... por exemplo, lista várias páginas do professor. (em resposta à pergunta editada > > >) Nota: não há aspas ("") na string de pesquisa.

8mm site:http://www.cameron.edu/~

... mostra professores interessados em filmes de 8mm, neste caso, Dr. Matt Jenkins

Divirta-se! 8 -)

    
por 13.10.2016 / 17:33