Quantas páginas você deve ter excedido o limite de uma Pesquisa personalizada do Google (apenas pensando)?
Eu recomendo usar Esfinge , Lucene estava bem até alguns milhares de itens sendo indexados, mas além disso era inutilizável, as buscas eram insuportavelmente lentas e reconstruir o índice levaria horas.
Temos o Sphinx sendo executado em um Rackspace Cloud Server com 1 GB de RAM juntamente com o restante dos serviços necessários para executar o site (Apache, PHP, MySQL, Memcached, etc.) e ele tem um ótimo desempenho.
O site em que o Sphinx está sendo executado atualmente tem > 70.000 artigos, as pesquisas são concluídas muito rapidamente e podem reconstruir todo o índice em ~ 11 segundos. Eu escolhi o Sphinx com base em recomendações de outros desenvolvedores e o conhecimento de que alguns grandes sites confiam nele para seus mecanismos de busca ( Neowin sendo um deles).