SSD de repente se torna ilegível - como diagnosticar?

2

Eu tenho um novo laptop há alguns dias, um Thinkpad x270. Infelizmente, tive alguns casos em que ele caiu. Acredito que tenha algo a ver com o SSD integrado, mas não consigo diagnosticar corretamente.

Estou executando uma nova instalação do Manjaro 17.

Quando ocorre o "crash", alguns aplicativos falham, outros conseguem permanecer, mas nenhum deles é capaz de funcionar corretamente. Quase tudo que tento fazer falha com um erro de E / S. Na área de trabalho, todos os ícones estão errados. Clicar no menu de energia mostra o menu, mas nenhum texto ou ícones são carregados. Se eu mudar para outro tty, vejo algumas mensagens sobre ext4-fs error unable to read itable block , mas nunca consigo logar.

Tenho certeza que isso significa que é devido ao meu SSD, mas forçar fsck na inicialização não parece fazer nada e gsmartcontrol diz que a unidade não suporta o SMART.

Como faço para diagnosticar meu problema corretamente, para que eu possa consertá-lo ou trocar meu laptop?

Aqui está a saída do gsmartcontrol, se ajudar:

smartctl 6.5 2016-05-07 r4318 [x86_64-linux-4.9.16-1-MANJARO] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Number:                       THNSF5512GPUK TOSHIBA
Serial Number:                      17IS10D1TANT
Firmware Version:                   51025KLA
PCI Vendor/Subsystem ID:            0x1179
IEEE OUI Identifier:                0x00080d
Controller ID:                      0
Number of Namespaces:               1
Namespace 1 Size/Capacity:          512'110'190'592 [512 GB]
Namespace 1 Formatted LBA Size:     512
Local Time is:                      Sat Apr  1 07:44:55 2017 CEST
Firmware Updates (0x02):            1 Slot
Optional Admin Commands (0x0017):   Security Format Frmw_DL *Other*
Optional NVM Commands (0x001e):     Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat
Warning  Comp. Temp. Threshold:     78 Celsius
Critical Comp. Temp. Threshold:     82 Celsius

Supported Power States
St Op     Max   Active     Idle   RL RT WL WT  Ent_Lat  Ex_Lat
 0 +     8.00W       -        -    0  0  0  0        0       0
 1 +     3.90W       -        -    1  1  1  1        0       0
 2 +     2.00W       -        -    2  2  2  2        0       0
 3 -   0.1200W       -        -    3  3  3  3     1000    1000
 4 -   0.0120W       -        -    4  4  4  4     5000   10000
 5 -   0.0060W       -        -    5  5  5  5   100000   50000

Supported LBA Sizes (NSID 0x1)
Id Fmt  Data  Metadt  Rel_Perf
 0 +     512       0         2
 1 -    4096       0         1

=== START OF SMART DATA SECTION ===
Read NVMe SMART/Health Information failed: NVMe Status 0x4002

Editado para adicionar: Desde então, eu iniciei no sysrescuecd e usei badblocks e fsck para tentar encontrar algum erro com o drive, mas ambos os testes voltaram sem erros.

Isso me deixa ainda mais confuso. O que poderia causar os erros que estou vendo, mas não ser visível para o diagnóstico?

Atualize novamente: Enviei o laptop, consegui trocar o SSD, sem problemas - mas o erro voltou. Então, como não é o SSD (como sugerem os badblocks), o que mais pode ser? Software afinal?

    
por MarkZ 01.04.2017 / 07:49

1 resposta

5

Então, depois de tentar inutilmente mais diagnósticos [1] e um kernel Linux corrigido, a solução correta parece ter sido uma atualização do BIOS.

Aparentemente, sob versões mais antigas do BIOS do meu Lenovo x270, há problemas com o SSD não ligar novamente depois de ir para um estado de baixo consumo de energia.

A aplicação da atualização do BIOS não foi totalmente trivial, pois eu não uso o Windows no meu laptop, portanto os utilitário não foi útil e a imagem inicializável da mesma página está em um formato estranho específico da Lenovo e nenhuma das minhas ferramentas usuais foi capaz para criar um stick USB inicializável a partir disso. No entanto, isso também é um problema conhecido e alguém criou um script Perl para extrair o arquivo ISO real do arquivo fornecido pela Lenovo. Usando a opção -o deste script, criei um arquivo ISO que eu era capaz de inicializar e aplicar a atualização.

Desde então, meu laptop parece estar estável.

[1]: A ferramenta nvme-cli foi útil, no entanto, esquecendo mais informações sobre meu SSD e, em última análise, se coincidentemente, levar-me à solução.

    
por 19.04.2017 / 22:49