A versão da réplica deve corresponder entre réplicas do mesmo fragmento no SolrCloud

4

Eu tenho uma nuvem solr (5.2.1) com 5 shards a 2 nodes.

Neste cluster, tenho 163.463.543 itens. Eu indexei 200.000 itens a mais e agora as versões / sizeInBytes entre dois nós de um cluster não são mais consistentes.

shard1   | sizeInBytes | segmentCount |  version |
--------------------------------------------------
replica1 | 71325055021 |           14 | 11877844 |
replica2 | 71330161457 |            8 | 11877874 |

shard2   | sizeInBytes | segmentCount |  version |
--------------------------------------------------
replica2 | 71658372259 |            9 | 11965329 |
replica1 | 71660446852 |           17 | 11965305 |

shard3   | sizeInBytes | segmentCount |  version |
--------------------------------------------------
replica1 | 72328398189 |           24 | 11978919 |
replica2 | 72329934372 |           20 | 11978971 |

shard4   | sizeInBytes | segmentCount |  version |
--------------------------------------------------
replica1 | 71398290694 |           10 | 11882893 |
replica2 | 71398972036 |           16 | 11883065 |

shard5   | sizeInBytes | segmentCount |  version |
--------------------------------------------------
replica2 | 71635961292 |           16 | 11920521 |
replica1 | 71636668652 |            9 | 11920667 |

Quando eu olho na página de status da nuvem web gui tudo parece bem. Alguma ideia do que aconteceu / como consertar?

    
por stoer 18.08.2015 / 14:15

1 resposta

3

Eu tenho feito muita pesquisa sobre este assunto, e a única referência que posso encontrar é este e-mail em uma lista de discussão do Solr: Link

SolrCloud works very differently than the old master-slave replication. The index is NOT copied from the leader to the other replicas, except in extreme recovery circumstances.

Each replica builds its own copy of the index independently from the others. Due to slight timing differences in the indexing operations, and possible actions related to transaction log replay on node restart, each replica may end up with a different index layout. There also could be differences in the number of deleted documents. Unless something goes really wrong, all replicas should contain the same live documents.

Thanks, Shawn

Eu vi a mesma coisa em minha própria experiência também. Recentemente, criei 10 novas coleções do Solr com 2 réplicas, carreguei centenas de milhares de documentos em cada uma das coleções e as versões não correspondem mais. Parece que a versão é um resquício de antes dos dias do SolrCloud e não precisa corresponder.

    
por 22.02.2016 / 22:11

Tags