Um problema de hardware é provável. Ventiladores entupidos e / ou com falha, temperatura muito alta, RAM ruim, CPU com defeito, fonte de alimentação com defeito, placa-mãe perto do final da vida ....
Alguns dias atrás, um servidor que eu gerenciei entrou em pânico, após mais de 400 dias de atividade. Eu reiniciei e funcionou por dois dias ou mais, então ele atingiu um "oops: cpu # n preso por 61s" para vários valores de n. Reinicializou novamente e hoje o pânico original do kernel apareceu novamente. O traço é (digitando novamente manualmente, ignorando endereços):
Kernel panic - not syncing: Fatal exception in interrupt
Pid: 0, comm: swapper Tainted: G D 2.6.32-41-server #89-Ubuntu
Call Trace:
<IRQ> panic
oops_end
die
do_general_protection
? consume_skb
general_protection
? put_page
skb_release_data
__kfree_skb
consume_skb
dev_kfree_skb_any
sky2_tx_complete
sky2_status_intr
? __queue_work
sky2_poll
net_rx_action
__do_softirq
? handle_IRQ_event
call_softirq
do_softirq
irq_exit
do_IRQ
ret_from_intr
<EOI> ? mwait_idle
? atomic_notifier_call_chain
? cpu_idle
? start_secondary
RIP put_page
O sistema operacional é o Ubuntu 10.04.4 x64. Como sempre funcionou e nada foi alterado antes dos pânicos, estou pensando em alguma falha de hardware. Antes da última reinicialização eu fiz um memtest completo e ele passou, assim como um fsck completo só para ter certeza. Já que o pânico está relacionado ao sky2 (controlador de rede maravilhoso), pode ser um problema com o nic? Existe algo que eu tenha esquecido? Considere que, entre os erros, tudo está funcionando perfeitamente (sem erros nos logs, sem pacotes descartados, sem lentidão).
Obrigado por qualquer ponteiro
Tags linux kernel-panic