Pânico súbito do kernel no servidor Linux

1

Alguns dias atrás, um servidor que eu gerenciei entrou em pânico, após mais de 400 dias de atividade. Eu reiniciei e funcionou por dois dias ou mais, então ele atingiu um "oops: cpu # n preso por 61s" para vários valores de n. Reinicializou novamente e hoje o pânico original do kernel apareceu novamente. O traço é (digitando novamente manualmente, ignorando endereços):

Kernel panic - not syncing: Fatal exception in interrupt
Pid: 0, comm: swapper Tainted: G        D    2.6.32-41-server #89-Ubuntu
Call Trace:
 <IRQ> panic
 oops_end
 die
 do_general_protection
 ? consume_skb
 general_protection
 ? put_page
 skb_release_data
 __kfree_skb
 consume_skb
 dev_kfree_skb_any
 sky2_tx_complete
 sky2_status_intr
 ? __queue_work
 sky2_poll
 net_rx_action
 __do_softirq
 ? handle_IRQ_event
 call_softirq
 do_softirq
 irq_exit
 do_IRQ
 ret_from_intr
 <EOI> ? mwait_idle
 ? atomic_notifier_call_chain
 ? cpu_idle
 ? start_secondary

RIP put_page

O sistema operacional é o Ubuntu 10.04.4 x64. Como sempre funcionou e nada foi alterado antes dos pânicos, estou pensando em alguma falha de hardware. Antes da última reinicialização eu fiz um memtest completo e ele passou, assim como um fsck completo só para ter certeza. Já que o pânico está relacionado ao sky2 (controlador de rede maravilhoso), pode ser um problema com o nic? Existe algo que eu tenha esquecido? Considere que, entre os erros, tudo está funcionando perfeitamente (sem erros nos logs, sem pacotes descartados, sem lentidão).

Obrigado por qualquer ponteiro

    
por Alberto 23.05.2012 / 11:52

1 resposta

2

Um problema de hardware é provável. Ventiladores entupidos e / ou com falha, temperatura muito alta, RAM ruim, CPU com defeito, fonte de alimentação com defeito, placa-mãe perto do final da vida ....

    
por 23.05.2012 / 12:02