Se negar o acesso dos rastreadores a um diretório via robots.txt, ele ainda indexará um arquivo nesse diretório se eu direcionar link?

1

Estou negando a indexação para uma pasta chamada pdf via robots.txt . No entanto, eu faço link direto para alguns arquivos que existem nesse diretório.

Mecanismos de pesquisa como o Google indexam esses arquivos ou os ignoram porque residem na pasta pdf ?

    
por kylex 21.03.2012 / 17:11

1 resposta

1

Resposta curta: Não.

Os rastreadores não podem indexar nada sob o prefixo de URL que você colocou no robots.txt.

Resposta mais longa: Depende.

A palavra-chave Allow não faz parte do padrão, mas alguns robôs a seguirão. Você pode usar isso para Permitir um URL específico e proibir a subárvore inteira que contém esse URL. A maioria dos bots trabalha em uma base de vitórias no primeiro jogo. O Google e o Bing funcionam com base em ganhos com sequência mais longa, independentemente da ordem das linhas Allow e Disallow .

    
por 21.03.2012 / 17:24

Tags