Sistema Linux (Debian Unstable): alguns aplicativos iniciaram o segfaulting sem motivo aparente

1

Eu tenho um domu Xen rodando Debian Unstable em um host Xen 3.4.2.

Esta manhã, notei que vários aplicativos iniciaram o seg-faulting.

Em particular, executar o "aptitude safe-upgrade" causa um segfault no aptitude-curses com o seguinte erro:

aptitude[1035]: segfault at 7f1006ed13f8 ip 0000000000544293 sp 00007fff94b37140 error 4 in aptitude-curses[400000+331000]

Este segfault é totalmente reproduzível.

Outros aplicativos (como reportbug e tentativas de login no KDE) também causam segfaults reproduzíveis.

Eu tenho outro domu do Xen rodando o Debian Unstable no mesmo host Xen, rodando o mesmo kernel (2.6.32.2), mas executar o "aptitude safe-upgrade" não causa um segfault. Ambas as casas parecem equivalentes, mas apenas uma delas é segfaults. Aqui estão alguns pontos para observar:

  • Ambos os domUs usam exatamente o mesmo kernel (64 bits)
  • Ambos possuem os mesmos binários para / usr / bin / aptitude-curses e todas as libs compartilhadas das quais ele depende (usei md5sum para comparar arquivos em ambos os sistemas e ldd para ver qual libs compartilhada o aptitude depende)
  • Eu fiz e2fsck -f no volume da raiz domU que tem os problemas e não houve erros reportados
  • Ambos os domUs têm a mesma quantidade de RAM e VCPUs alocados a eles
  • Eu sei que os segfaults podem apontar para falhas de hardware, mas dado que esses segfaults são reproduzíveis e que um domU equivalente não tem problemas (mesmo se eu mudar a ordem na qual os domUs são criados, esperando forçar cada um a ocupar um diferente parte da RAM física), sugere strongmente que o hardware não é um problema
  • Eu também me pergunto se alguns arquivos estão corrompidos, mas como eu disse, o aptitude e todas as suas bibliotecas dependentes (como relatado pelo ldd) parecem ok
  • Eu reiniciei o problema domU muitas vezes e reiniciei o host Xen OS uma vez
  • Eu tentei inicializar o domU de segfaulting no modo de usuário único (definindo o nível padrão como 1 em / etc / inittab) e "aptitude safe-upgrade" ainda sendo segfaults.

Eu não acho que isso seja um problema Xen, mas sem saber o que está causando isso eu não posso ter certeza.

Estou totalmente perplexo com a razão de uma máquina virtual manter a segmentação e outra VM semelhante não.

Qualquer ajuda seria muito apreciada.

Obrigado.

    
por user7406 03.01.2010 / 02:55

2 respostas

1

Execute o programa segfaulting no gdb, com símbolos de depuração para todas as bibliotecas relevantes instaladas, e diagnostique a causa do problema a partir dali.

    
por 03.01.2010 / 03:54
0

Pode ser uma falha no módulo de memória que estraga a memória dos aplicativos em execução. Experimente o memtest86 + para garantir que seus módulos de RAM estejam bem.

Se sim, então provavelmente você deve começar a analisar libs: / lib, / usr / lib etc. Uma maneira fácil é md5sum + diff em diferentes caixas Linux: talvez algumas delas estejam realmente corrompidas?

    
por 03.01.2010 / 16:27