Rastreador / aranha do site que gera resultados no mysql

4

Foi sugerido que usássemos o mysql para a pesquisa do nosso site, pois ele estaria rodando no mesmo servidor que hospeda nosso servidor web (nginx) e nosso db (mysql).

Como nem todas as nossas páginas são criadas a partir do banco de dados, sugerimos que tenhamos um rastreador que possa rastrear o site e lançar o URL e dados da página no mysql e ter um índice de esfinge sobre isso.

Alguém sabe de uma aranha de código aberto que tem uma opção de armazenamento do mysql fora da caixa.

Obrigado.

    
por Ian 22.02.2010 / 16:14

1 resposta

1

Eu acho que sphider é o que você está procurando - nós tivemos resultados ok com isso antes. Além disso, ele pode indexar pdfs e docs, o que é muito útil

link

    
por 17.03.2010 / 16:54