kdump issues - não salvando problemas de despejo / rede de memória

1

Eu tenho uma VM VMWare em um host ESX que possui partições LVM. Eu configurei o kdump com uma configuração muito básica - ext /dev/mapper/logical-volume-name e path /data/crash . Quando eu forço um travamento do sistema, ele carrega o kernel do kdump e mostra os volumes lógicos, os carrega e mostra que está salvando o despejo de memória e leva cerca de 30 segundos para exportar cerca de 2,5 GB, o que é normal. O problema é que, quando ele é reinicializado, ele volta, mas não há conectividade de rede (não pode sair e não pode entrar pela rede), no entanto, todos os serviços de rede estão em execução e uma simples reinicialização (sem falhas) isto. Além disso, outro problema - o despejo de memória vmcore salvo não foi salvo. Eu testei isso em uma VM no VirtualBox e isso funciona executando um equivalente do CentOS do servidor RHEL que está atualmente em produção e que atualmente está tendo esses problemas do kdump.

Alguma idéia ou coisas que eu deveria procurar?

    
por drewrockshard 13.09.2010 / 04:38

1 resposta

1

Falei com um dos desenvolvedores do KDump e confirmei que esse é um bug conhecido. No momento, não posso fazer nenhuma alteração na produção, mas tenho uma ideia muito suspeita de que o kernel precisa ser atualizado e / ou algo entre a VM e a necessidade do Host da VM analisada.

from    Eric W. Biederman 
to  Drew Decker 
cc  [email protected],
[email protected],
[email protected],
[email protected]
date    Tue, Jan 25, 2011 at 1:50 PM
subject Re: KDump Question/Issues (Need a developer's eyes)

That does sound like a bug in the RHEL kernel interacting with VMware.

The fact that the reboot doesn't reset the hardware is frankly scary.

At this point any RHEL kernel is old and has not been updated by the
many many bug fixes that have happened between when they branched off
linus's tree and the present, and presumably comes with a support
contract by people that are paid to help you, and understand those
details, so I recommend you talk to the fine people at Red Hat.  They
should be able to help.

Usually problems like this come down to driver issues of some sort, not
issues in the actual kexec on panic infrastructure.  Although in this
case I would also suspect how the kdump kernel is calling reboot.

Good luck to you,
Eric
    
por 26.01.2011 / 15:31