Verificação de Exceções da Máquina com o Wildcard TE420 e o Asus P5N-E SLI

2

Eu tenho visto exceções de verificação de máquina ao tentar chamar o dahdi_cfg (ou, às vezes, mesmo carregando apenas o módulo do kernel) para configurar uma placa PCI-E Digium Wildcard TE420 Quad-Span T1. Rodando Debian Wheezy (kernel 3.2.0-4), dahdi kernel modules 2.6.1.

Verificação da máquina é algo como isto (recuperado usando o netconsole; a máquina está morta após o MCE):

CPU 1: Machine Check Exception: 5 Bank 5: b200121020080400
RIP !INEXACT! 10:<ffffffff810146a3> {mwait_idle+0x7f/0xac}
TSC b773cee10f 
PROCESSOR 0:6f7 TIME 1354843514 SOCKET 0 APIC 1 microcode 66
Run the above through 'mcelog --ascii'
CPU 1: Machine Check Exception: 5 Bank 0: b200004000000800
RIP !INEXACT! 10:<ffffffff810146a3> {mwait_idle+0x7f/0xac}
TSC b773cee10f 
PROCESSOR 0:6f7 TIME 1354843514 SOCKET 0 APIC 1 microcode 66
Run the above through 'mcelog --ascii'
Some CPUs didn't answer in synchronization
Machine check: Processor context corrupt
Kernel panic - not syncing: Fatal machine check on current CPU

Por mexer em com qual plug-in PCI Express está conectado, bem como remover a outra placa PCI-E (uma placa de vídeo nVidia), às vezes ele não faz a verificação imediatamente. Eu então consegui obter um erro no log do kernel. Eu recebo essas mensagens, o erro é a última linha:

[    6.222755] wct4xxp 0000:02:08.0: 5th gen card with initial latency of 2 and 1 ms per IRQ
[    6.222767] wct4xxp 0000:02:08.0: Firmware Version: c01a016d
[    6.225338] wct4xxp 0000:02:08.0: FALC Framer Version: 3.1
[    6.225477] wct4xxp 0000:02:08.0: Found a Wildcard: Wildcard TE420 (5th Gen)
[    6.225525] wct4xxp 0000:02:08.0: VPM450: Not Present
[   13.089474] wct4xxp 0000:02:08.0: Span 1 configured for ESF/B8ZS
[   13.089616] wct4xxp 0000:02:08.0: RCLK source set to span 1
[   13.089621] wct4xxp 0000:02:08.0: Recovered timing mode, RCLK set to span 1
[   13.089627] wct4xxp 0000:02:08.0: SPAN 1: Primary Sync Source
[   15.192016] wct4xxp 0000:02:08.0: Interrupts not detected.

A verificação de /proc/interrupts confirma que as interrupções esperadas de 1000 por segundo não estão presentes. Além disso, as luzes de alarme (atualmente não há T1s conectados) não estão ligadas; não há luzes acesas no quadro.

O Google não achou muito útil. Há um patch para os drivers dahdi, mas isso já deve estar incluído na versão que estou usando. Alguém mais teve esse problema com uma revisão antiga da placa (resolvida obtendo uma nova placa), mas eu tenho a revisão mais recente. Eu infelizmente não tenho uma máquina de reposição para verificar.

    
por derobert 07.12.2012 / 19:36

1 resposta

3

Acontece que a correção foi bastante simples - uma atualização do BIOS. A atualização de 0801 para 1406 (a mais recente até o momento desta redação, de 2009) a corrigiu.

Link direto para a 1406 atualização do BIOS . Ou a página de download da P5N-E SLI deve ter o mais recente.

    
por 07.12.2012 / 19:36