Eu acho que sphider é o que você está procurando - nós tivemos resultados ok com isso antes. Além disso, ele pode indexar pdfs e docs, o que é muito útil
Foi sugerido que usássemos o mysql para a pesquisa do nosso site, pois ele estaria rodando no mesmo servidor que hospeda nosso servidor web (nginx) e nosso db (mysql).
Como nem todas as nossas páginas são criadas a partir do banco de dados, sugerimos que tenhamos um rastreador que possa rastrear o site e lançar o URL e dados da página no mysql e ter um índice de esfinge sobre isso.
Alguém sabe de uma aranha de código aberto que tem uma opção de armazenamento do mysql fora da caixa.
Obrigado.
Eu acho que sphider é o que você está procurando - nós tivemos resultados ok com isso antes. Além disso, ele pode indexar pdfs e docs, o que é muito útil
Tags mysql web-crawler sphinxsearch