Como posso usar o netconsole para ajudar a resolver um pânico do kernel?

6

Quando tento usar um raid como root, meu sistema entra em pânico.

Eu quero ler a saída do kernel logo antes do pânico, mas não consigo rolar para cima. Depois de pesquisar no Google um pouco, eu queria experimentar o netconsole. mas não obtenho nenhuma saída na segunda máquina

partes relevantes do meu grub.conf atual

title Gentoo Linux 3.0.6
root (hd0,0)
kernel /boot/linux-3.0.6-gentoo root=/dev/md3

title Gentoo Linux 3.0.6 (debug netconsole)                                                                                                    
root (hd0,0)                                                                                                                                   
kernel /boot/linux-3.0.6-gentoo-debug root=/dev/md3 netconsole=@/,[email protected]/00:18:f3:a8:09:61                                          
#kernel /boot/linux-3.0.6-gentoo-debug root=/dev/md3 [email protected]/eth0,[email protected]/00:18:f3:a8:09:61

title Gentoo Linux 3.0.6 (no root/auto root)
root (hd0,0)
kernel /boot/linux-3.0.6-gentoo
  • o primeiro falha com um pânico do kernel
  • o segundo é o que eu tento usar netconsole
  • o 3º começa mas usa a raiz errada / antiga

O outro computador está executando um LiveCD do Kubuntu em que iniciei nc -u -l 6666 .
E se eu iniciar o (primeiro) computador com a opção 3th grub, posso executar nc -u 192.168.0.27 6666 para se comunicar com o segundo computador.

A diferença entre /boot/linux-3.0.6-gentoo e /boot/linux-3.0.6-gentoo-debug é que ativei:

  • Kernel hacking - > Depuração do Kernel
  • Kernel hacking - > Atrasar cada mensagem printk de boot por N milissegundos
  • Drivers de dispositivos - > Suporte de dispositivo de rede - > Suporte de registro do console de rede

Perguntas

  1. A configuração do meu (2º) grub está definida corretamente?
  2. Existem mais opções de configuração do kernel que eu deveria estar habilitando?
  3. Há mais informações sobre o hardware específico da máquina para o qual devo fornecer detalhes?
  4. Existe alguma maneira de me permitir rolar de volta depois de um pânico?
por Puggan Se 08.07.2012 / 13:50

1 resposta

4

Acabei de ter o mesmo problema no gentoo com um kernel 3.5.0. Não importa o exemplo on-line que tentei, nenhuma saída chegou ao cliente até que eu executei o seguinte comando:

 dmesg -n 7

Eu originalmente tentei

dmesg -n 8

que foi sugerido na documentação do kernel, mas que retornou

localhost ~ # dmesg -n 8
dmesg: unknown level '8'

onde o dmesg -n 7 funcionou

localhost ~ # dmesg -n 7
localhost ~ # echo check > /sys/block/md0/md/sync_action

Aqui está o que eu tenho no cliente

datastore1 ~ # nc -l -p 30000 -u
[ 9698.913098] md: data-check of RAID array md0
[ 9698.913112] md: minimum _guaranteed_  speed: 1000 KB/sec/disk.
[ 9698.913124] md: using maximum available idle IO bandwidth (but not more than 200000 KB/sec) for data-check.
[ 9698.913150] md: using 128k window, over a total of 1048512k.
[ 9718.197555] md: md0: data-check done.

BTW, aqui está como eu configuro o netconsole:

modprobe netconsole netconsole="@/eth0,[email protected]/"
    
por 21.08.2012 / 20:40