O Linux trava devido ao que parece ser uma falha relacionada ao hardware, sem nada nos logs. Como solucionar problemas?

0

Tenho um Dell Latitude E6520 com placa de vídeo NVIDIA GF119 [Quadro NVS 4200M] e um disco rígido SAMSUNG SSD PM810 de 2,5 "e 256 GB (firmware AXM06D1Q).

Ocasionalmente (costumava ser uma vez a cada poucos meses, agora mais ou menos uma ou duas vezes por semana) ele trava onde o laptop ainda está ligado e a tela ainda mostra minha área de trabalho congelada no tempo (o mouse não se move, o miniaplicativo do monitor do sistema não está se movendo). Eu não posso SSH no laptop remotamente. A única coisa que posso fazer é ligar é puxar o poder (pressione e segure o botão de energia).

Invariavelmente, não há nada nos logs. Tudo estava correndo bem com mensagens operacionais normais e, em seguida, nada, até que as mensagens de inicialização normal, quando eu trago de volta.

Eu tentei duas distros diferentes, que vieram com kernels diferentes, então não pense que é relacionado a software.

Como posso começar a solucionar algo assim? Poderia ser o disco rígido? Ou RAM?

ATUALIZAÇÃO 2012-07-14

Configure um trabalho em segundo plano para despejar a saída do dmesg em um log a cada 0,1 segundo para capturar qualquer saída do dmesg que possa não estar sendo registrada.

Estava trabalhando no laptop até cerca de duas horas da madrugada de ontem, e depois estava fora o dia todo, voltei para o laptop às cinco da tarde de hoje para encontrá-lo trancado. Infelizmente, nada no dmesg parece uma causa provável:

kern  :info  : [Fri Jul 13 08:53:13 2012] usb 2-1.2: new full-speed USB device number 4 using ehci_hcd
kern  :err   : [Fri Jul 13 08:53:13 2012] usb 2-1.2: device descriptor read/64, error -32
kern  :err   : [Fri Jul 13 08:53:13 2012] hub 2-1:1.0: unable to enumerate USB device on port 2
kern  :info  : [Fri Jul 13 08:53:14 2012] usb 2-1.2: new high-speed USB device number 5 using ehci_hcd
kern  :info  : [Fri Jul 13 08:53:14 2012] Initializing USB Mass Storage driver...
kern  :info  : [Fri Jul 13 08:53:14 2012] scsi6 : usb-storage 2-1.2:1.0
kern  :info  : [Fri Jul 13 08:53:14 2012] usbcore: registered new interface driver usb-storage
kern  :info  : [Fri Jul 13 08:53:14 2012] USB Mass Storage support registered.
kern  :notice: [Fri Jul 13 08:53:15 2012] scsi 6:0:0:0: Direct-Access     Motorola A955             0001 PQ: 0 ANSI: 2
kern  :notice: [Fri Jul 13 08:53:15 2012] scsi 6:0:0:1: CD-ROM            Motorola A955             0001 PQ: 0 ANSI: 2
kern  :notice: [Fri Jul 13 08:53:15 2012] sd 6:0:0:0: Attached scsi generic sg2 type 0
kern  :warn  : [Fri Jul 13 08:53:15 2012] sr1: scsi3-mmc drive: 0x/0x caddy
kern  :debug : [Fri Jul 13 08:53:15 2012] sr 6:0:0:1: Attached scsi CD-ROM sr1
kern  :notice: [Fri Jul 13 08:53:15 2012] sr 6:0:0:1: Attached scsi generic sg3 type 5
kern  :notice: [Fri Jul 13 08:53:15 2012] sd 6:0:0:0: [sdb] Attached SCSI removable disk
kern  :info  : [Fri Jul 13 11:34:42 2012] usb 2-1.2: USB disconnect, device number 5

: - (

    
por user145664 12.07.2012 / 21:03

2 respostas

0

Suponho que vou dar uma facada neste. Em situações como essas, eu SEMPRE gosto de testar todos os componentes (RAM, HD, Power, bad caps, etc.) antes de mais nada, só porque economiza muito tempo e esforço mais tarde na estrada. Basicamente, este conjunto de passos é uma boa maneira de cobrir suas bases para que você não esteja batendo a cabeça na parede mais tarde, porque você perdeu alguma coisa.

Verifique no computador se há algum indicador óbvio de falha. Capacitores com vazamento, ventiladores quebrados, conectores queimados, componentes super quentes, placas de vídeo que estão morrendo, tudo o que é visível geralmente é um bom primeiro passo.

Em seguida, há uma variedade de utilitários de disco inicializáveis que você pode usar para testar a integridade de várias peças de hardware. Uma ferramenta simples, mas eficaz, que eu gosto de usar para verificar a integridade do disco rígido é o Teste de condicionamento físico do Drive . Esta ferramenta irá essencialmente passar pela verificação de unidades para setores defeituosos, bem como realizar várias outras verificações no processo.

Outra coisa simples para testar seria RAM defeituosa, com algo como Memtest86 + .

    
por 12.07.2012 / 21:30
0

Você pode redirecionar a saída do syslogd para outro syslogd na rede. Veja link o exemplo para *.* @finlandia enviar tudo para um syslogd remoto.

    
por 12.07.2012 / 21:40

Tags