Redis: failover failover - sentinelas não podem eleger novo nó mestre

1

Eu configurei quatro instâncias de servidor e sentinel em quatro máquinas virtuais diferentes em uma configuração simples de mestre-escravo. A replicação de chave funciona bem, e todos os nós de redis reconhecem um ao outro (estou me referindo às opções known-sentinel e known-slave ).

O problema surge quando estou tentando simular uma falha. As sentinelas continuam dizendo que não podem eleger um novo mestre ( failover-abort-not-chosen ):

12481:X 22 Jun 17:20:05.761 # <__IP1__>:51002 voted for a3ba8d8cd0c15c8b186b44ba529b83d3a8424a42 27
12481:X 22 Jun 17:20:14.140 # -sdown master mymaster <__IP2__> 6379
12481:X 22 Jun 17:20:14.140 # -odown master mymaster <__IP2__> 6379
12481:X 22 Jun 17:20:16.567 # -failover-abort-not-elected master mymaster <__IP2__> 6379

Outra coisa estranha é que, quando eu consultar o estado da sentinela em redis-cli , continuo recebendo valores maiores para o número de instâncias sentinelas disponíveis do que a contagem real (que obviamente não pode ser maior que 4 (certo?)) .

$ redis-cli -p 51001
> info
[...]
master0:name=mymaster,status=ok,address=91.120.59.231:6379,slaves=3,sentinels=8

Além disso, recebo essas mensagens -dup-sentinel ao iniciar o sentinel:

14563:X 23 Jun 11:10:18.015 * -dup-sentinel master mymaster <__IP_MASTER__> 6379 #duplicate of <__IP_SLAVE2__>:51003 or 65db9ddba84433f71aa77c9263807e6abd939d2c

Aqui está uma das configurações das sentinelas:

daemonize yes
pidfile "/var/run/redis/redis-sentinel.pid"
logfile "/var/log/redis/redis-sentinel.log"

# bind 192.168.1.100 10.0.0.1
# port 26379

port 51004

dir "/var/lib/redis"

sentinel monitor mymaster <__IP_MASTER__> 6379 2
sentinel failover-timeout mymaster 60000
sentinel auth-pass mymaster <___________PASSW___________>
sentinel config-epoch mymaster 0
sentinel leader-epoch mymaster 55428

# Generated by CONFIG REWRITE
maxclients 4064
sentinel known-slave mymaster <__IP_SLAVE1__> 6379
sentinel known-slave mymaster <__IP_SLAVE2__> 6379
sentinel known-slave mymaster <__IP_SLAVE3__> 6379
sentinel known-sentinel mymaster <__IP_SLAVE1__> 51002 bfea8e89873353d5c1e9ed498b17f298bd6b6082
sentinel known-sentinel mymaster <__IP_MASTER__> 26379 c04fc07022a251e56e81e21dbe018bd471745038
sentinel known-sentinel mymaster <__IP_SLAVE2__> 51003 b5a56eb69abb5893203ecf7b1a7d28ae4aa06ab5
sentinel known-sentinel mymaster <__IP_MASTER__> 51001 be1ff6c9e4a62abea132c24447fd3cb38d221496
sentinel known-sentinel mymaster <__IP_SLAVE1__> 26379 f5a7fd0ee199afc02ffafc0e822363acf5595b1c
sentinel known-sentinel mymaster <__IP_SLAVE2__> 26379 6328962293b7838fa88b9f176b9bc4cc08f2e26d
sentinel current-epoch 26

Os arquivos de log não são realmente informativos ... existe uma maneira de torná-lo um pouco mais detalhado? Você tem alguma ideia do que estou sentindo aqui?

Obrigado antecipadamente!

Posto de afixação:

Verifiquei as configurações do firewall, deveria ter sido bom, eu ainda estava recebendo o mesmo erro quando desliguei o firewall completamente.

    
por Gergely Lukacsy 22.06.2016 / 17:50

2 respostas

1

Extraído de configuração padrão do sentinel :

# *** IMPORTANT ***
#
# By default Sentinel will not be reachable from interfaces different than
# localhost, either use the 'bind' directive to bind to a list of network
# interfaces, or disable protected mode with "protected-mode no" by
# adding it to this configuration file.
#
# Before doing that MAKE SURE the instance is protected from the outside
# world via firewalling or other means.
#
# For example you may use one of the following:
#
# bind 127.0.0.1 192.168.1.1

Portanto, tente vincular seu server's IP .

Gluck!

    
por 01.03.2017 / 12:15
1

As sentinelas antigas não são removidas da configuração. Consulte os documentos redis sentinel

Executar: SENTINEL RESET mymaster e por um tempo, novo mestre deve ser eleito.

    
por 13.06.2017 / 18:27