ATUALIZAÇÃO: O problema era hardware defeituoso no switch. Obrigado a todos vocês pelas boas sugestões de depuração. Resposta correta dada ao MattyB por sugerir o uso de um switch diferente para ver se o problema persistiu.
Olá serverfault,
Estou tentando depurar um problema em vários nós que estão detectando repetidamente a perda do link por 1-2 minutos por vez, quando não deve haver perda de link.
Servidores:
- HP DL360 G5
- 1 Gigabit Ethernet Broadcom NetXtreme II de 2 portas Broadcom NetXtreme II (usando o driver bnx2)
- 1 Controlador Ethernet Gigabit Intel 82571EB de 4 portas (Cobre) (rev 06) (usando o driver e1000e)
Fatos:
- Em todos os nós, as duas portas Broadcom e uma porta Intel estão conectadas ao mesmo switch.
- UPDATE : perda de link é detectada em portas em ambos os NICs, Broadcom e Intel
- Todas as portas estão na velocidade Gb / s, exceto as portas Intel em dois dos nós, que estão na velocidade de 100Mb / s. Todas as velocidades definidas usando a negociação automática.
- Todos os nós foram atualizados recentemente do RHEL 5.0 para o RHEL 5.3.
No momento, estou tentando obter acesso ao switch para forçar links Gbps / full duplex. Existe alguma coisa outra do que isso poderia ser feito para diagnosticar ou corrigir esse problema? Que informação adicional seria útil?
EDITAR: Eu executei o tcpdump em uma das interfaces afetadas, e tudo o que posso ver são pacotes LLDP e uma única Consulta de Membros do Grupo IGMP. Eu também configurei o switch para forçar todas as portas para links de 1000 Mbps, full duplex. Isso indica que o problema é interno ao nó e não é causado por nenhuma configuração no comutador?
====== Mensagens de log ======% Oct 29 11:30:36 db1 kernel: bnx2: eth1 NIC Copper Link is Down
Oct 29 11:30:37 db1 kernel: bnx2: eth0 NIC Copper Link is Down
Oct 29 11:30:39 db1 kernel: bnx2: eth1 NIC Copper Link is Up, 1000 Mbps full duplex, receive & transmit flow control ON
Oct 29 11:30:39 db1 kernel: bnx2: eth0 NIC Copper Link is Up, 1000 Mbps full duplex
Oct 29 11:31:08 db1 kernel: bnx2: eth0 NIC Copper Link is Down
Oct 29 11:31:10 db1 kernel: bnx2: eth0 NIC Copper Link is Up, 1000 Mbps full duplex, receive & transmit flow control ON
Oct 29 12:56:41 db1 kernel: bnx2: eth1 NIC Copper Link is Down
Oct 29 12:56:41 db1 kernel: bnx2: eth0 NIC Copper Link is Down
Oct 29 12:58:34 db1 kernel: bnx2: eth1 NIC Copper Link is Up, 1000 Mbps full duplex
Oct 29 12:58:34 db1 kernel: bnx2: eth0 NIC Copper Link is Up, 1000 Mbps full duplex
Oct 29 12:59:02 db1 kernel: bnx2: eth1 NIC Copper Link is Down
Oct 29 12:59:03 db1 kernel: bnx2: eth0 NIC Copper Link is Down
Oct 29 12:59:05 db1 kernel: bnx2: eth1 NIC Copper Link is Up, 1000 Mbps full duplex, receive & transmit flow control ON
Oct 29 12:59:05 db1 kernel: bnx2: eth0 NIC Copper Link is Up, 1000 Mbps full duplex
Oct 29 12:59:34 db1 kernel: bnx2: eth0 NIC Copper Link is Down
Oct 29 12:59:35 db1 kernel: bnx2: eth1 NIC Copper Link is Down
Oct 29 12:59:37 db1 kernel: bnx2: eth0 NIC Copper Link is Up, 1000 Mbps full duplex, receive & transmit flow control ON
====== Saída do ethtool para todas as interfaces conectadas em um nó ======% [root@db1 ~]# ethtool eth0
Settings for eth0:
Supported ports: [ TP ]
Supported link modes: 10baseT/Half 10baseT/Full
100baseT/Half 100baseT/Full
1000baseT/Full
Supports auto-negotiation: Yes
Advertised link modes: 10baseT/Half 10baseT/Full
100baseT/Half 100baseT/Full
1000baseT/Full
Advertised auto-negotiation: Yes
Speed: 1000Mb/s
Duplex: Full
Port: Twisted Pair
PHYAD: 1
Transceiver: internal
Auto-negotiation: on
Supports Wake-on: g
Wake-on: g
Link detected: yes
[root@db1 ~]# ethtool eth1
Settings for eth1:
Supported ports: [ TP ]
Supported link modes: 10baseT/Half 10baseT/Full
100baseT/Half 100baseT/Full
1000baseT/Full
Supports auto-negotiation: Yes
Advertised link modes: 10baseT/Half 10baseT/Full
100baseT/Half 100baseT/Full
1000baseT/Full
Advertised auto-negotiation: Yes
Speed: 1000Mb/s
Duplex: Full
Port: Twisted Pair
PHYAD: 1
Transceiver: internal
Auto-negotiation: on
Supports Wake-on: g
Wake-on: g
Link detected: yes
[root@db1 ~]# ethtool eth2
Settings for eth2:
Supported ports: [ TP ]
Supported link modes: 10baseT/Half 10baseT/Full
100baseT/Half 100baseT/Full
1000baseT/Full
Supports auto-negotiation: Yes
Advertised link modes: 10baseT/Half 10baseT/Full
100baseT/Half 100baseT/Full
1000baseT/Full
Advertised auto-negotiation: Yes
Speed: 100Mb/s
Duplex: Full
Port: Twisted Pair
PHYAD: 1
Transceiver: internal
Auto-negotiation: on
Supports Wake-on: pumbag
Wake-on: d
Current message level: 0x00000001 (1)
Link detected: yes