Eu tenho um ambiente de teste que é criado todas as manhãs e depois destruído todas as noites. Parte do ambiente é uma instância do SolrCloud (versão 4.7) conectada a um cluster remoto do Zookeeper.
A instância do Solr tem um fragmento e cerca de 8 núcleos. Alguns dos principais índices são razoavelmente grandes em tamanho (~ 1,2 GB), então leva um tempo para construir o índice a partir do zero todas as manhãs.
Para evitar o atraso, estou tentando fazer o backup do índice todos os dias e restaurá-lo em uma nova instância do Solr no dia seguinte.
Para fazer backup, estou apenas chamando curl localhost/solr/mycore/replication?command=backup&location=/tmp/backup
Em seguida, movo os arquivos de backup para algum armazenamento permanente.
Isso funciona bem.
De manhã, uma nova instância do Solr é iniciada sem nada em seu índice. Em seguida, copio os arquivos de backup de índice para essa nova instância no local correto e reinicio o Solr.
No entanto, após a reinicialização, o Solr não mostra que o número de documentos no índice aumentou. Se eu olhar para as estatísticas de replicação no console da web do solr eu posso ver o seguinte para o meu mainindex versão = 0, gen = 1 e tamanho = 1,2 GB. Este atributo de tamanho parece indicar que está "vendo" os arquivos que eu restaurei, mas não os contava como parte do índice.
O zookeeper está permanentemente em pé, por isso, se olhar para o meu gráfico de nuvem de solr, posso ver a instância de solr que foi destruída no dia anterior como "Gone". Não sei se isso é relevante.
Gostaria de saber como posso fazer com que o Solr reconheça arquivos de backup restaurados.