O ISC DHCP não sincroniza as concessões entre pares

Question

O ISC DHCP não sincroniza as concessões entre pares

#1 resposta do (2 votos)
#2 resposta do (0 votos)
#3 resposta do (0 votos)

1

Eu uso o ISC DHCP versão 4.1.1 no Debian GNU / Linux em ambos os servidores. Eu tentei resolver o seguinte problema usando várias versões do ISC DHCP, mas permaneceu o mesmo.

Minha configuração para failover entre dois servidores em diferentes sub-redes é:

#-----------------------------------------------
# Primary Server
#-----------------------------------------------

authoritative;
default-lease-time 900;
max-lease-time 1800;         
option domain-name "foo.com";
option domain-name-servers 10.12.0.254;

failover peer "foo" {
    primary;
    address 10.12.0.254;
    port 647;
    peer address 10.10.10.12;
    peer port 647;
    max-response-delay 30;
    max-unacked-updates 10;
    load balance max seconds 3;
    mclt 1800;  
    split 128;
}

subnet 10.12.0.0 netmask 255.255.0.0 {
    pool {
        failover peer "foo";
        range 10.12.10.0 10.12.112.0;
        range 10.12.112.12 10.12.255.254;
        deny dynamic bootp clients;
    }
    option routers 10.12.0.254;
    option subnet-mask 255.255.0.0;
    option broadcast-address 10.12.255.255;
}

#-----------------------------------------------
# Secondary Server
#-----------------------------------------------

authoritative;
default-lease-time 900;
max-lease-time 1800;
option domain-name "foo.com";
option domain-name-servers 10.12.0.254;

failover peer "foo" {
        secondary;
        address 10.10.10.12;
        port 647;
        peer address 10.12.0.254;
        peer port 647;
        max-response-delay 30;
        max-unacked-updates 10;
        load balance max seconds 3;
}

subnet 10.12.0.0 netmask 255.255.0.0 {
        pool {
                failover peer "foo";
                range 10.12.10.0 10.12.112.0;
                range 10.12.112.12 10.12.255.254;
        deny dynamic bootp clients;
        }
    option routers 10.12.0.254;
    option subnet-mask 255.255.0.0;
    option broadcast-address 10.12.255.255;
}

subnet 10.10.10.0 netmask 255.255.255.240 {
}

O ajudante IP (também conhecido como auxiliar UDP) e a retransmissão DHCP estão habilitados no roteador que conecta a rede do servidor principal com a rede do servidor secundário Eu posso pingar e ssh de um servidor para o outro e voltar.

Quando inicio o serviço dhcpd em ambos os servidores, eles não conseguem equilibrar suas concessões.

Eu colei uma amostra dos logs de ambos os servidores

Servidor principal

Sep 19 10:31:11 primary dhcpd: failover peer foo: I move from recover to startup
Sep 19 10:31:11 primary dhcpd: failover peer foo: I move from startup to recover
Sep 19 10:31:11 primary dhcpd: Sent update request all message to foo
Sep 19 10:31:20 primary dhcpd: peer foo: disconnected
Sep 19 10:31:22 primary dhcpd: failover peer foo: peer moves from recover-done to recover-done
Sep 19 10:31:22 primary dhcpd: failover peer foo: peer moves from recover-done to recover-done
Sep 19 10:31:45 primary dhcpd: DHCPINFORM from 10.12.181.177 via eth1
Sep 19 10:31:45 primary dhcpd: DHCPACK to 10.12.181.177 (00:17:42:c0:e3:ce) via eth1
Sep 19 10:32:45 primary dhcpd: DHCPDISCOVER from 00:16:d3:e5:3a:3c (PC1) via eth1: not responding (recovering)
Sep 19 10:32:46 primary dhcpd: DHCPINFORM from 10.12.181.177 via eth1
Sep 19 10:32:46 primary dhcpd: DHCPACK to 10.12.181.177 (00:17:42:c0:e3:ce) via eth1
Sep 19 10:32:49 primary dhcpd: DHCPDISCOVER from 00:16:d3:e5:3a:3c (PC1) via eth1: not responding (recovering)
Sep 19 10:32:57 primary dhcpd: DHCPDISCOVER from 00:16:d3:e5:3a:3c (PC1) via eth1: not responding (recovering)
Sep 19 10:33:13 primary dhcpd: DHCPDISCOVER from 00:19:99:95:41:99 (PC2) via eth1: not responding (recovering)
Sep 19 10:33:13 primary dhcpd: DHCPDISCOVER from 00:16:d3:e5:3a:3c (PC1) via eth1: not responding (recovering)
Sep 19 10:33:17 primary dhcpd: DHCPDISCOVER from 00:19:99:95:41:99 (PC2) via eth1: not responding (recovering)
Sep 19 10:33:25 primary dhcpd: DHCPDISCOVER from 00:19:99:95:41:99 (PC2) via eth1: not responding (recovering)
Sep 19 10:33:41 primary dhcpd: DHCPDISCOVER from 00:19:99:95:41:99 (PC2) via eth1: not responding (recovering)

Servidor secundário

Sep 19 10:31:11 secondary dhcpd: Update request all from foo: sending update
Sep 19 10:31:23 secondary dhcpd: Wrote 22 leases to leases file.
Sep 19 10:31:23 secondary dhcpd: failover peer foo: I move from recover-done to startup
Sep 19 10:31:23 secondary dhcpd: failover peer foo: I move from startup to recover-done
Sep 19 10:31:45 secondary dhcpd: DHCPINFORM from 10.12.181.177 via 10.12.0.1
Sep 19 10:31:45 secondary dhcpd: DHCPACK to 10.12.181.177 (00:17:42:c0:e3:ce) via eth0
Sep 19 10:32:45 secondary dhcpd: DHCPDISCOVER from 00:16:d3:e5:3a:3c via 10.12.0.1: not responding (recover done)
Sep 19 10:32:46 secondary dhcpd: DHCPINFORM from 10.12.181.177 via 10.12.0.1
Sep 19 10:32:46 secondary dhcpd: DHCPACK to 10.12.181.177 (00:17:42:c0:e3:ce) via eth0
Sep 19 10:32:49 secondary dhcpd: DHCPDISCOVER from 00:16:d3:e5:3a:3c via 10.12.0.1: not responding (recover done)
Sep 19 10:32:57 secondary dhcpd: DHCPDISCOVER from 00:16:d3:e5:3a:3c via 10.12.0.1: not responding (recover done)
Sep 19 10:33:13 secondary dhcpd: DHCPDISCOVER from 00:19:99:95:41:99 via 10.12.0.1: not responding (recover done)
Sep 19 10:33:13 secondary dhcpd: DHCPDISCOVER from 00:16:d3:e5:3a:3c via 10.12.0.1: not responding (recover done)
Sep 19 10:33:17 secondary dhcpd: DHCPDISCOVER from 00:19:99:95:41:99 via 10.12.0.1: not responding (recover done)
Sep 19 10:33:25 secondary dhcpd: DHCPDISCOVER from 00:19:99:95:41:99 via 10.12.0.1: not responding (recover done)
Sep 19 10:33:41 secondary dhcpd: DHCPDISCOVER from 00:19:99:95:41:99 via 10.12.0.1: not responding (recover done)
Sep 19 10:34:46 secondary dhcpd: DHCPDISCOVER from 00:1a:4b:45:3a:2f via 10.12.0.1: peer holds all free leases
Sep 19 10:34:51 secondary dhcpd: DHCPDISCOVER from 00:1a:4b:45:3a:2f via 10.12.0.1: peer holds all free leases
Sep 19 10:34:59 secondary dhcpd: DHCPDISCOVER from 00:1a:4b:45:3a:2f via 10.12.0.1: peer holds all free leases
Sep 19 10:35:16 secondary dhcpd: DHCPDISCOVER from 00:1a:4b:45:3a:2f via 10.12.0.1: peer holds all free leases
Sep 19 10:38:28 secondary dhcpd: DHCPDISCOVER from 00:16:d3:e5:3a:3c via 10.12.0.1: not responding (recover done)
Sep 19 10:38:32 secondary dhcpd: DHCPDISCOVER from 00:16:d3:e5:3a:3c via 10.12.0.1: not responding (recover done)

Eu não pareço ter as linhas de registro de balanceamento de carga, então não acho que o balanceamento de locações esteja acontecendo ...

Sent update request all message to foo
Update request all from foo: sending update

O processo de balanceamento parece estar preso nas duas linhas acima

Se eu desligar o daemon do DHCPD em um servidor, o ponto não parece assumir o controle mesmo se detectar que outro ponto está inativo

Como posso resolver este problema?

Agradeço antecipadamente (e desculpe pelo meu péssimo inglês): -)

dhcp failover linux load-balancing

por PsyStyle 19.09.2011 / 13:34

3 respostas

0

A mensagem de erro peer holds all free leases também pode significar que a solicitação foi recebida na interface de rede incorreta, por exemplo, se um computador estiver configurado apenas para obter um IP em eth0 , mas a solicitação DHCP for recebida em eth1 . deny dynamic bootp clients é típico para essa configuração. No meu caso, uma interface era para a rede da estação de trabalho e a outra apenas para impressoras e alguém conectava uma estação de trabalho à rede da impressora.

Veja meu blog postando sobre quando encontrei a mensagem de erro e não encontrei razão óbvia no Debian também.

Não me lembro de ter visto a mensagem not responding (recovering) , mas também tinha peer holds all free leases nos dois servidores DHCP.

por 09.12.2014 / 21:25

0

Eu encontrei este problema antes. Para mim foi o firewall bloqueando a porta 647 / tcp em ambos os servidores. Eu corri o seguinte em cada servidor e resolveu o problema.

firewall-cmd --add-port=647/tcp --permanent
firewall-cmd --reload

Depois, reinicie o serviço dhcpd.

por 06.04.2018 / 16:24

Tags dhcp failover linux load-balancing

Uma conta de usuário para muitos computadores Como limitar os usuários normais de acessar o registro, a política de grupo, etc? [fechadas]

score 2 · Accepted Answer

A mensagem not responding (recovering) indica que o servidor não está respondendo porque está se recuperando de um failover (ou início inicial). E provavelmente ainda está preenchendo os bancos de dados de leasing com todas as concessões gratuitas do seu pool, o que pode demorar um pouco se você tiver um pool grande.

Tente usar um pool menor para verificar se o failover está funcionando corretamente e, em seguida, reajuste. Seu alcance é muito grande e provavelmente a causa do motivo de ele parecer pendurado na atualização.