Por que definir um atraso para a indexação do apache solr?

7

O Apache Solr é configurado por padrão para ter um certo atraso (no meu caso 2 minutos) antes de indexar o conteúdo. Eu vi em outros posts como reduzir isso, mas estou tendo problemas para entender por que você iria querer um atraso em primeiro lugar? Quais seriam as desvantagens de reduzir o atraso para 0?

    
por David Seddon 13.07.2012 / 10:36

1 resposta

6

Está aguardando mais conteúdo.

Quando o Solr executa uma operação de consolidação para trazer mais documentos para o índice, ele precisa derrubar o núcleo do pesquisador existente e iniciar um novo. Essa é uma operação intensiva de recursos e destrói todos os caches do antigo pesquisador (e executa novamente o processo de aquecimento do cache). Se você está fazendo suas atualizações em várias solicitações diferentes, é menos do que ideal girar um novo buscador (potencialmente dezenas de vezes em alguns segundos, dependendo de como você está fazendo as adições de documentos), tornando as atualizações de documentos mais lentas e destruindo o desempenho de quaisquer consultas de pesquisa que chegam durante esse período.

As configurações de <autoCommit> no seu solrconfig.xml controlam o atraso ou você pode substituí-lo completamente e confirmar instantaneamente adicionando ?commit=true ao URL do seu% HTTPPOST à URL /update .

    
por 15.07.2012 / 01:00

Tags