Zookeeper - substituição do membro de cluster com falha

1

Estou ciente de que, enquanto houver quorum, o meu grupo de zeladores continuará trabalhando. Mas o servidor ausente tem algum impacto notável no desempenho do cluster?

Vamos supor que 1 de 3 servidores falhe (e seja destruído). Eu acho que posso entrar em um novo servidor (limpo) sem tempo de inatividade, desde que ele tenha o mesmo id de servidor que o antigo e os outros dois servidores possam se conectar a ele (ele tem o mesmo IP / hostname em suas configurações) ?

Qual é o impacto do terceiro servidor "ressincronizar" (isto é, isso afeta a velocidade na qual o consenso para novas coisas é atingido)? Quanto tempo essa operação normalmente demora (em relação à quantidade de dados no zookeeper)?

Posso (ou devo) apenas copiar dados e registro de dados de um dos servidores existentes? Instantâneos provavelmente são seguros para serem copiados como estão, mas os logs de transações podem precisar de uma "cópia point-in-time" (eu tenho o btrfs CoW, então isso não é problema)?

Ou, para ser mais específico, também me pergunto se os dados em todos os nós são equivalentes (além das últimas gravações) e intercambiáveis. Ou é alguma coisa específica do id do servidor armazenada dentro?

    
por fiction 28.02.2016 / 14:21

1 resposta

0

reingressar com o mesmo ID do servidor, mas nenhum dado quebrará o quorum. Você precisa primeiro remover o serverID antigo de todo o servidor restante e adicionar um novo servidor usando um novo ID.

    
por 09.06.2016 / 19:12

Tags