Ubuntu 12.04 congelou, exigindo powercycle. O que devo procurar / grep nos logs?

8

Esta não é a primeira vez que o Ubuntu congela. Na última vez, verifiquei "arquivos atualizados recentemente" em /var/log/ e /var/crash/ , e a causa do problema parecia ser "LibreOffice".

Agora, isso aconteceu novamente.

Nada funciona, exceto o botão de desligamento (com base na experiência anterior). Eu não consigo nem abrir o tty usando Ctrl+Alt+F{1..6}

Eu tenho muita memória (7,7 GB), Ram (2 x 3,16 Ghz) e espaço no disco rígido (100 GB em um SSD de 256 GB).

Não há nada que eu possa fazer, exceto desligar. O computador passou por um memtest.

O que devo procurar (grep) nos logs?

Atualização: enviei um erro aqui: link

    
por Abe 14.06.2012 / 22:46

3 respostas

2

Um congelamento soa muito como um erro no Xorg ou no kernel. Você já tentou ssh para a caixa? Às vezes, isso funciona mesmo se as interfaces de usuário locais forem irresponsáveis. Uma conexão ssh funcional pode ser muito útil para depurar esse tipo de problema.

A partir dos dados que você forneceu, eu usaria o log do kernel. Parece que o libreoffice caiu por algum motivo e, em um segundo, o cromo também desapareceu. Então definitivamente havia algum tipo de problema naquela época. Veja mais de perto o log em torno dessas linhas de erro e veja se é possível identificar a primeira mensagem de erro dessa cascata de eventos. Os timestamps à esquerda devem ser úteis, pois qualquer evento relacionado ao congelamento deve ser bem próximo dos dois que mencionei.

Apenas a julgar pelos dois eventos incluídos no seu log, parece provável que o crash do libreoffice de alguma forma tenha feito o X instável, causando tanto o congelamento da UI quanto o crash do chrome. Você notará que o chrome caiu em uma biblioteca X.

    
por MvG 25.06.2012 / 18:02
0
  

Eu estava rodando no modo padrão 'vanilla', embora eu tenha xfce   e o kde instalado.

Uma instalação de baunilha, no meu entender, significa uma instalação limpa de uma distribuição. Tente uma instalação limpa (como no formato tudo , crie um novo usuário e tente novamente). Claro, faça backup de seus arquivos importantes antes de fazer isso.

Além disso, em vez de reinstalar, você pode tentar criar um novo usuário . Isso pode apontar o problema: se o novo usuário funcionar, o problema estará nas configurações do usuário doméstico. Se isso não acontecer, é um problema do sistema (e reinstalá-lo provavelmente resolveria)

Não instale mais nada. Não use PPAs. Apenas atualize o software através do gerenciador de atualização ou do apt-get, sem alterar / adicionar o arquivo sources.list. Isso significa instalação de baunilha. Veja como o sistema responde por 3-4 dias. Em seguida, comece a adicionar software um a um para descobrir o pacote problemático.

Após a reinicialização, o sistema geralmente adiciona um ".old" ou ".0" no nome do arquivo.

Eu diria que esses arquivos de log seriam informativos:

tar czf mylogs.tar.gz --ignore-failed-read ~/.xsession-errors.old /var/log/Xorg.0.log.old /var/log/dmesg.0 /var/log/syslog.1 /var/log/kern.log.1 /var/log/apport.log.1 /var/log/pm-powersave.log.1
file-roller mylogs.tar.gz

... ou se preferir separadamente:

cat ~/.xsession-errors.old
cat /var/log/Xorg.0.log.old
cat /var/log/dmesg.0
cat /var/log/syslog.1
cat /var/log/kern.log.1
cat /var/log/apport.log.1
cat /var/log/pm-powersave.log.1
    
por Savvas Radevic 16.06.2012 / 13:47
0

Várias aplicações segfault e kernel oops geralmente são sintomas de problemas de hardware. Tente primeiro rodar um memtest, ele provavelmente irá falhar com erros.

    
por Giovanni Toraldo 27.06.2012 / 21:58