Fedora 15: Linux 2.6.40 + tg3 = dor

2

Eu tenho um blade IBM BladeCenter rodando o Fedora 15. Tudo funciona bem com os kernels 2.6.38, mas quando eu inicializo com um kernel 2.6.40, perco a conectividade depois de alguns segundos. Remover e depois reinserir o módulo tg3 restaura a conectividade por cerca de cinco segundos, após o qual eu perco a conectividade novamente.

Estes são blades dual-Xeon. Este tem dois Xeons 2.8GHz com HT e 2GB de RAM. O blade é um 8832-L1X executando a versão 1.13 do BIOS. A saída de lspci é:

00:00.0 Host bridge: Broadcom CMIC-LE Host Bridge (GC-LE chipset) (rev 33)    
00:00.1 Host bridge: Broadcom CMIC-LE Host Bridge (GC-LE chipset)    
00:00.2 Host bridge: Broadcom CMIC-LE Host Bridge (GC-LE chipset)    
00:01.0 VGA compatible controller: ATI Technologies Inc Rage XL (rev 27)
00:0f.0 Host bridge: Broadcom CSB6 South Bridge (rev b0)
00:0f.1 IDE interface: Broadcom CSB6 RAID/IDE Controller (rev b0)
00:0f.2 USB Controller: Broadcom CSB6 OHCI USB Controller (rev 05)
00:0f.3 ISA bridge: Broadcom GCLE-2 Host Bridge
00:10.0 Host bridge: Broadcom CIOB-E I/O Bridge with Gigabit Ethernet (rev 12)
00:10.2 Host bridge: Broadcom CIOB-E I/O Bridge with Gigabit Ethernet (rev 12)
01:00.0 Ethernet controller: Broadcom Corporation NetXtreme BCM5704S Gigabit Ethernet (rev 02)    
01:00.1 Ethernet controller: Broadcom Corporation NetXtreme BCM5704S Gigabit Ethernet (rev 02)

Aqui está um trecho de dmesg com kernel-PAE-2.6.38.8-32.fc15.i686 (funcionando):

[11.545123] tg3.c:v3.116 (December 3, 2010)
[11.545152] tg3 0000:01:00.0: PCI INT A -> GSI 16 (level, low) -> IRQ 16
[11.599499] tg3 0000:01:00.0: eth0: Tigon3 [partno(BCM95704A41) rev 2002] (PCIX:133MHz:64-bit) MAC address
[11.599510] tg3 0000:01:00.0: eth0: attached PHY is serdes (1000Base-SX Ethernet) (WireSpeed[0])
[11.599518] tg3 0000:01:00.0: eth0: RXcsums[1] LinkChgREG[0] MIirq[0] ASF[1] TSOcap[0]
[11.599525] tg3 0000:01:00.0: eth0: dma_rwctrl[769f4000] dma_mask[64-bit]
[11.599577] tg3 0000:01:00.1: PCI INT B -> GSI 17 (level, low) -> IRQ 17
[11.627997] tg3 0000:01:00.1: eth1: Tigon3 [partno(BCM95704A41) rev 2002] (PCIX:133MHz:64-bit) MAC address
[11.628066] tg3 0000:01:00.1: eth1: attached PHY is serdes (1000Base-SX Ethernet) (WireSpeed[0])
[11.628074] tg3 0000:01:00.1: eth1: RXcsums[1] LinkChgREG[0] MIirq[0] ASF[0] TSOcap[1]
[11.628082] tg3 0000:01:00.1: eth1: dma_rwctrl[769f4000] dma_mask[64-bit]
[22.000286] tg3 0000:01:00.0: eth0: Link is up at 1000 Mbps, full duplex
[22.000294] tg3 0000:01:00.0: eth0: Flow control is off for TX and off for RX

E aqui está um do kernel-PAE-2.6.40.6-0.fc15.i686 (não funcionando):

[10.262141] tg3.c:v3.119 (May 18, 2011)
[10.262177] tg3 0000:01:00.0: PCI INT A -> GSI 16 (level, low) -> IRQ 16
[10.309325] tg3 0000:01:00.0: eth0: Tigon3 [partno(BCM95704A41) rev 2002] (PCIX:133MHz:64-bit) MAC address         
[10.309336] tg3 0000:01:00.0: eth0: attached PHY is serdes (1000Base-SX Ethernet) (WireSpeed[0], EEE[0])
[10.309344] tg3 0000:01:00.0: eth0: RXcsums[1] LinkChgREG[0] MIirq[0] ASF[1] TSOcap[1]
[10.309351] tg3 0000:01:00.0: eth0: dma_rwctrl[769f4000] dma_mask[64-bit]
[10.309431] tg3 0000:01:00.1: PCI INT B -> GSI 17 (level, low) -> IRQ 17
[10.361613] tg3 0000:01:00.1: eth1: Tigon3 [partno(BCM95704A41) rev 2002] (PCIX:133MHz:64-bit) MAC address         
[10.361624] tg3 0000:01:00.1: eth1: attached PHY is serdes (1000Base-SX Ethernet) (WireSpeed[0], EEE[0])
[10.361633] tg3 0000:01:00.1: eth1: RXcsums[1] LinkChgREG[0] MIirq[0] ASF[0] TSOcap[1]
[10.361640] tg3 0000:01:00.1: eth1: dma_rwctrl[769f4000] dma_mask[64-bit]
[21.054276] tg3 0000:01:00.0: eth0: Link is up at 1000 Mbps, full duplex
[21.054284] tg3 0000:01:00.0: eth0: Flow control is off for TX and off for RX

Novamente, o sintoma é que a rede funciona bem por alguns segundos, mas depois pára completamente. Fazer um rmmod tg3 seguido por um modprobe tg3 restaura a conectividade por alguns segundos. Nada incomum aparece em qualquer registro.

Eu tentei algumas soluções alternativas de opções do kernel. Não me lembro exatamente de qual, mas sei que tentei acpi=noirq , acpi=ht , irqpoll e noapic .

modinfo , menos as muitas linhas alias mostradas:

filename: /lib/modules/2.6.40.6-0.fc15.i686.PAE/kernel/drivers/net/tg3.ko
firmware:       tigon/tg3_tso5.bin
firmware:       tigon/tg3_tso.bin
firmware:       tigon/tg3.bin
version:        3.119
license:        GPL
description:    Broadcom Tigon3 ethernet driver
author:         David S. Miller ([email protected]) and Jeff Garzik ([email protected])
srcversion:     389C3BA89E4ECF8460A74C0
depends:    
vermagic:       2.6.40.6-0.fc15.i686.PAE SMP mod_unload 686
parm:           tg3_debug:Tigon3 bitmapped debugging message enable value (int)

O Fedora relata o kernel em 2.6.40 para " compatibilidade com o espaço de usuário mais antigo ".

Atualizar : fazer ifconfig eth0 down seguido por um novo ifconfig para atualizá-lo e adicionar as rotas apropriadas faz com que tudo funcione indefinidamente. Fazer um rmmod tg3 seguido por um modprobe tg3 faz com que ele funcione por alguns segundos e, em seguida, quebre novamente. Então pelo menos eu tenho uma solução para agora - adicionando /etc/rc.d/init.d network restart em rc.local . Eu ainda gostaria de saber o que está errado e se há uma correção adequada.

    
por David Schwartz 16.10.2011 / 22:45

0 respostas

Tags