Tente isto: link
(não tenho experiência com este produto ou outros produtos de pesquisa empresarial).
Existe alguma solução alternativa de código aberto (com um console da web)?
Tente isto: link
(não tenho experiência com este produto ou outros produtos de pesquisa empresarial).
Solr, do projeto Apache Lucene. Trecho do site
O Solr é um servidor de pesquisa empresarial de código aberto baseado na biblioteca de pesquisa Lucene Java, com APIs XML / HTTP e JSON, hit highlighting, pesquisa facetada, cache, replicação, uma interface de administração web e muitos outros recursos. Ele é executado em um contêiner de servlet Java, como o Tomcat.
Eu usei 'htdig' no passado para pesquisar na intranet. É bom e indexa documentos pdf por padrão. Depois de adicionar filtros que podem converter documentos em formato de texto para indexação, ele também começará a oferecer suporte a outros formatos.
Não é de código aberto, mas o Microsoft Search 4.0 é gratuito neste link
Eu diria que vale a pena tentar, gostei da formatação dos resultados retornados, mas o problema era que os resultados incluiriam documentos que um usuário não podia acessar devido a segurança. Por isso, não foi bom para nós, pois os nomes dos documentos também podem conter informações restritas, como "Carta de aviso de Bob.doc"
Encontrei uma solução com o Google Desktop Search (que pode ser usado como um appliance da Web com um plug-in): leia mais ...
Tags search open-source google