O Googlebot procura repetidamente por arquivos que não estão no meu servidor

1

Estou hospedando um site para uma organização de voluntários. Mudei o site para o WordPress, mas nem sempre foi assim. Eu suspeito que em um ponto ele foi hackeado mal.

Meu arquivo de log de erros do Apache cresceu para 122 kB nas últimas 18 horas. A grande maioria dos erros registrados é desta forma - é repetida centenas de vezes hoje, sozinho, em meus arquivos de log:

[Mon Nov 12 18:29:27 2012] [error] [client xx.xxx.xx.xxx] File does not exist: /home/*******/public_html/*******.org/calendar.php
[Mon Nov 12 18:29:27 2012] [error] [client xx.xxx.xx.xxx] File does not exist: /home/*******/public_html/*******.org/404.shtml

(verifiquei que xx.xxx.xx.xxx era um servidor do Google.)

Eu suspeito que houve uma falha de segurança em algum lugar antes, provavelmente em calendar.php , que foi explorada.

Os arquivos não existem mais, mas pode haver muitos backlinks que existem aqui, por isso o googlebot está tão interessado em rastreá-los.

Como faço para corrigir isso normalmente? Eu ainda gostaria que o Google indexasse o site. Eu só quero dizer de alguma forma para não procurar mais por esses arquivos.

    
por John 13.11.2012 / 03:51

1 resposta

2

Essa é uma das coisas que o erro 410 pode ser usado para.

O Google e outros mecanismos de pesquisa podem usar essas informações para determinar se um URL é não é mais válido e espera-se que nunca seja válido novamente e, portanto, remova-o de seus índices.

    
por 13.11.2012 / 03:54