Solução de problemas de falha de hardware de disco (sem mídia presente) no Linux?

0

Ok, eu estava trabalhando no meu Asus TX300CA, que tem um tablet com CPU e um disco rígido ( /dev/sda ) e um dock de teclado com outro disco rígido ( /dev/sdb ). As partições nas unidades do dock de teclado foram montadas, quando de repente comecei a receber "erro de entrada / saída: leitura" ou algo semelhante quando tentei cat arquivos nessas unidades ( ls ainda estava funcionando). Então eu reiniciei, e percebi que o sistema não vai nem mesmo inicializar se a parte do tablet estiver conectada ao dock de teclado (apenas o splash de inicialização com o logotipo da ASUS mostra, e ele nunca prossegue para o menu de inicialização do GRUB).

Felizmente, minha instalação primária do Ubuntu 14.04 está no disco rígido que está na parte de laptop, então eu desencaixei e inicializei no sistema operacional; então eu conectei o dock do teclado novamente. As mensagens no syslog não indicam imediatamente qualquer erro:

Oct 29 21:48:14 mypc kernel: [ 1348.596871] ACPI Error: [^^^XHC_.SSP1] Namespace lookup failure, AE_NOT_FOUND (20150930/psargs-359)
Oct 29 21:48:14 mypc kernel: [ 1348.596896] ACPI Error: Method parse/execution failed [\_SB.PCI0.LPCB.EC0._Q82] (Node f389e288), AE_NOT_FOUND (20150930/psparse-542)
Oct 29 21:48:14 mypc kernel: [ 1348.601331] asus_wmi: Unknown key 75 pressed
Oct 29 21:48:18 mypc kernel: [ 1352.297028] usb 4-1: new SuperSpeed USB device number 2 using xhci_hcd
Oct 29 21:48:18 mypc kernel: [ 1352.320942] usb 4-1: New USB device found, idVendor=05e3, idProduct=0612
Oct 29 21:48:18 mypc kernel: [ 1352.320953] usb 4-1: New USB device strings: Mfr=1, Product=2, SerialNumber=0
Oct 29 21:48:18 mypc kernel: [ 1352.320959] usb 4-1: Product: USB3.0 Hub
Oct 29 21:48:18 mypc kernel: [ 1352.320964] usb 4-1: Manufacturer: GenesysLogic
Oct 29 21:48:18 mypc kernel: [ 1352.329092] hub 4-1:1.0: USB hub found
Oct 29 21:48:18 mypc kernel: [ 1352.329477] hub 4-1:1.0: 4 ports detected
....
Oct 29 21:48:26 mypc mtp-probe: checking bus 4, device 4: "/sys/devices/pci0000:00/0000:00:14.0/usb4/4-1/4-1.4"
Oct 29 21:48:26 mypc mtp-probe: bus: 4, device: 4 was not an MTP device
Oct 29 21:48:26 mypc kernel: [ 1360.719291] usb-storage 4-1.2:1.0: USB Mass Storage device detected
Oct 29 21:48:26 mypc kernel: [ 1360.719384] scsi host4: usb-storage 4-1.2:1.0
Oct 29 21:48:26 mypc kernel: [ 1360.719787] usbcore: registered new interface driver usb-storage
Oct 29 21:48:26 mypc kernel: [ 1360.723564] usbcore: registered new interface driver uas
Oct 29 21:48:27 mypc kernel: [ 1361.067216] ax88179_178a 4-1.4:1.0 eth0: register 'ax88179_178a' at usb-0000:00:14.0-1.4, ASIX AX88179 USB 3.0 Gigabit Ethernet, 74:d0:2b:0a:6b:62
Oct 29 21:48:27 mypc kernel: [ 1361.078810] usbcore: registered new interface driver ax88179_178a
Oct 29 21:48:27 mypc NetworkManager[1001]: <warn> failed to allocate link cache: (-12) Object not found
Oct 29 21:48:27 mypc NetworkManager[1001]: <info> (eth0): carrier is OFF
Oct 29 21:48:27 mypc NetworkManager[1001]: <info> (eth0): new Ethernet device (driver: 'ax88179_178a' ifindex: 4)
...

... acima, mostrando que a porta Ethernet e o hub USB no dock foram detectados; e a única coisa relacionada ao disco é:

Oct 29 21:48:29 mypc kernel: [ 1363.961212] scsi 4:0:0:0: Direct-Access      osz osz  osz osz osz osz AD04 PQ: 0 ANSI: 6
Oct 29 21:48:29 mypc kernel: [ 1363.964557] sd 4:0:0:0: [sdb] Attached SCSI removable disk
Oct 29 21:48:29 mypc kernel: [ 1363.964978] sd 4:0:0:0: Attached scsi generic sg1 type 0

Então, o estado deste disco agora é:

  • sudo mount nem exibe partições de /dev/sdb
  • sudo fdisk -l não mostra este dispositivo, mas também WARNING: GPT (GUID Partition Table) detected on '/dev/sda'! The util fdisk doesn't support GPT. Use GNU Parted. (embora /dev/sdb não tenha sido inicializável)
  • sudo parted -l não reporta este dispositivo /dev/sdb em todos

Os únicos comandos desse tipo são:

$ sudo lshw -class disk -class storage -short
H/W path      Device     Class          Description
===================================================
/0/100/1f.2              storage        7 Series Chipset Family 6-port SATA Controller [A
/0/2          scsi0      storage        
/0/2/0.0.0    /dev/sda   disk           128GB SanDisk SSD U100
/0/3          scsi4      storage        
/0/3/0.0.0    /dev/sdb   disk           osz osz osz osz
/0/3/0.0.0/0  /dev/sdb   disk           

$ sudo smartctl --all /dev/sdb
smartctl 6.2 2013-07-26 r3841 [i686-linux-4.4.0-57-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

/dev/sdb: Unknown USB bridge [0x05e3:0x0735 (0x4104)]
Please specify device type with the -d option.

Use smartctl -h to get a usage summary

$ sudo smartctl --all -d scsi /dev/sdb
smartctl 6.2 2013-07-26 r3841 [i686-linux-4.4.0-57-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Vendor:               osz osz
Product:              osz osz osz osz
Revision:             AD04
Logical block provisioning type unreported, LBPME=-1, LBPRZ=0
Device type:          disk
Local Time is:        Sun Oct 29 22:25:01 2017 CET
NO MEDIUM present on device
A mandatory SMART command failed: exiting. To continue, add one or more '-T permissive' options.

Além disso, gksu gnome-disks mostra este disco também:

Bem, eu não consigo lembrar como essa unidade foi chamada, mas certamente não foi osz osz osz ... (isso pode mudar para orj orj... após a reinicialização, o que eu tive que fazer, quando o sistema falhou novamente enquanto eu estava escrevendo neste ponto), então eu posso dizer que algo está errado.

Também consegui imprimir algo lendo diretamente em /sys :

$ cat /sys/bus/scsi/devices/4\:0\:0\:0/model 
 osz osz osz osz
$ cat /sys/bus/scsi/devices/4\:0\:0\:0/vendor
 orj orj
$ cat /sys/bus/scsi/devices/4\:0\:0\:0/dh_state
detached
$ cat /sys/bus/scsi/devices/4\:0\:0\:0/state
running
$ cat /sys/bus/scsi/devices/4\:0\:0\:0/type
0

Então, minha pergunta é: o que mais eu posso fazer para solucionar problemas de um dispositivo em um estado como esse? Posso forçar o sistema operacional a reexaminar de alguma forma, e despejar mensagens de erro mais detalhadas - e onde eu procuraria por elas (por exemplo, syslog )? Que outras ferramentas (se houver) posso usar para consultar um dispositivo em um estado como este?

    
por sdaau 29.10.2017 / 22:43

0 respostas