O GoogleBot é conhecido por experimentar URLs que já existiam no passado. Por exemplo, recentemente fiz uma revisão completa do meu site. Os URLs antigos que foram indexados no passado ainda estão sendo atingidos (404) pelo Googlebot meses depois. Eu sei de fato que meu site não usa internamente essas URL's de nenhuma maneira. Alguns estão ligados por sites externos; alguns nem sequer estão ligados externamente.
Você pode querer usar as Ferramentas do Google para webmasters, se ainda não o fez. Você pode usar as ferramentas para ver o que foi indexado e o que deu um 404. Você também pode ver quais páginas estão vinculadas a partir de quais locais externos.