Use o robots.txt para impedir que os rastreadores obtenham versões antigas das páginas do Trac

2

olhando para o meu Apache access.log, vejo que os rastreadores tendem a obter versões antigas de páginas e documentos, como:

119.63.196.86 - - [10/Jun/2011:10:36:31 +0200] "GET /wiki/News?version=14 HTTP/1.1" 200 6073 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)"

Eu gostaria que eles não acrescentassem o sufixo ?version=x aos URLs, para que eles só obtivessem os conteúdos mais recentes.

Existe uma maneira de fazer isso através do arquivo robots.txt (ou outros mecanismos que eu não conheço?

    
por Andrea Spadaccini 10.06.2011 / 10:47

1 resposta

3

Se você estiver usando o trac fora da caixa, então essas páginas têm NOINDEX e NOFOLLOW sobre elas, já que elas serão rastreadas e não serão indexadas.

    
por 10.06.2011 / 13:22