Eu tenho um cluster que consiste em máquinas virtuais CentOS6.5 e CentOS7. Eu me deparei com um problema em que a interface de rede, eth0, está sendo excluída por motivos desconhecidos e estou procurando ajuda sobre como solucionar isso e descobrir o que está causando isso.
Nos logs, vejo o seguinte:
2890545:Apr 30 10:59:50 nginx-web ntpd[600]: Deleting interface #4 eth0, xxx.xx.xxx.xxx#123, interface stats: received=644, sent=644, dropped=0, active_time=86400 secs
2890726-Apr 30 10:59:50 nginx-web ntpd[600]: 10.65.72.23 interface xxx.xx.xxx.xxx -> (none)
2890831-Apr 30 10:59:50 nginx-web ntpd[600]: 10.65.72.22 interface xxx.xx.xxx.xxx -> (none)
2890936-Apr 30 10:59:50 nginx-web ntpd[600]: 10.65.72.21 interface xxx.xx.xxx.xxx -> (none)
Isso parece alinhar-se à expiração da concessão do DHCP conforme o que vejo aproximadamente 24 horas antes do evento:
Apr 29 10:59:45 nginx-web dhclient[693]: DHCPDISCOVER on eth0 to 255.255.255.255 port 67 interval 4 (xid=0x43441f77)
Apr 29 10:59:45 nginx-web dhclient[693]: DHCPREQUEST on eth0 to 255.255.255.255 port 67 (xid=0x43441f77)
Apr 29 10:59:45 nginx-web dhclient[693]: DHCPOFFER from xxx.xx.xxx.x
Apr 29 10:59:45 nginx-web dhclient[693]: DHCPACK from xxx.xx.xxx.x (xid=0x43441f77)
Apr 29 10:59:47 nginx-web NET[803]: /usr/sbin/dhclient-script : updated /etc/resolv.conf
Apr 29 10:59:47 nginx-web dhclient[693]: bound to xxx.xx.xxx.xxx -- renewal in 35453 seconds.
O problema está afetando apenas as VMs do CentOS7.
Primeiro notamos que o avahi-daemon estava inicialmente excluindo a interface e achamos que esse poderia ser o problema, no entanto, depois de desabilitar esse serviço, o serviço ntpd exclui a interface agora, então suspeito que isso seja relacionado ao dhcp.