erro EXT4-fs após a atualização do Ubuntu 17.04

12

Eu tenho um Dell XPS 15 9550 . Eu tenho executado o Ubuntu 16.10 nele por quatro meses sem dramas.

Dois dias atrás, atualizei para o Ubuntu 17.04 . Cerca de uma hora após a atualização, meu disco rígido remontou ao modo somente leitura. Quando eu pulei para uma tela tty, apareceu:

[ 746.341551] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #525023: comm NetworkManager: reading directory iblock 0
[ 746.343318] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #524289: comm pool: reading directory iblock 0
[ 746.356125] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #11272213: comm systemd-udevd: reading directory iblock 0
[ 746.356139] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #11272210: comm systemd-udevd: reading directory iblock 0
[ 746.356332] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #11272193: comm systemd-udevd: reading directory iblock 0
[ 746.356338] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #11272825: comm systemd-udevd: reading directory iblock 0
[ 746.356400] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #11272210: comm systemd-udevd: reading directory iblock 0
[ 746.474632] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #524539: comm unity-settings-: reading directory iblock 0
[ 746.992814] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #5506108: comm BrowserBlocking: reading directory iblock 0
[ 746.304451] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #5506117: comm BrowserBlocking: reading directory iblock 0

Veja o que o fdisk -l mostra:

Disk /dev/nvme0n1: 477 GiB, 512110190592 bytes, 1000215216 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disklabel type: gpt
Disk identifier: 3CD27380-DAC8-48DC-910A-D084CE857DA3

Device             Start        End   Sectors   Size Type
/dev/nvme0n1p1      2048    1026047   1024000   500M EFI System
/dev/nvme0n1p2   1026048    1288191    262144   128M Microsoft reserved
/dev/nvme0n1p3   1288192  487948287 486660096 232.1G Microsoft basic data
/dev/nvme0n1p4 972302336  973223935    921600   450M Windows recovery environmen
/dev/nvme0n1p5 973223936  998094847  24870912  11.9G Windows recovery environmen
/dev/nvme0n1p6 998094848 1000204287   2109440     1G Windows recovery environmen
/dev/nvme0n1p7 487948288  939046911 451098624 215.1G Linux filesystem
/dev/nvme0n1p8 939046912  972302335  33255424  15.9G Linux swap

Partition table entries are not in disk order.

Eu reiniciei e continuei a receber o erro uma vez por hora. Então eu reinstalei o Ubuntu 17.04 do zero . No entanto, ainda estou recebendo o mesmo problema.

Eu tentei executar o fsck criando um arquivo / forcefsck (criei um script de shell de wrapper que adiciona o sinalizador -v e gera stdout em um arquivo). Aqui está o resultado:

fsck.fat 4.0 (2016-05-06)                               
Checking we can access the last sector of the filesystem
Boot sector contents:                                   
System ID "MSDOS5.0"                                    
Media byte 0xf8 (hard disk)                             
       512 bytes per logical sector                     
      4096 bytes per cluster                            
      6206 reserved sectors                             
First FAT starts at byte 3177472 (sector 6206)          
         2 FATs, 32 bit entries                         
    508416 bytes per FAT (= 993 sectors)                
Root directory start at cluster 2 (arbitrary size)      
Data area starts at byte 4194304 (sector 8192)          
    126976 data clusters (520093696 bytes)              
63 sectors/track, 255 heads                             
      2048 hidden sectors                               
   1024000 sectors total                                
Reclaiming unconnected clusters.                        
Checking free cluster summary.                          
/dev/nvme0n1p1: 212 files, 15526/126976 clusters    

Eu tentei inicializar de um USB ao vivo e rodando e2fsck -p /dev/nvme0n1p7 como sugerido aqui ( link ). Não deu nenhum erro.

Eu também tentei executar smartctl -t long /dev/nvme0n1p7 , mas os resultados parecem indicar que a ferramenta não funciona com meu SSD específico:

smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.10.0-19-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Number:                       PM951 NVMe SAMSUNG 512GB
Serial Number:                      S29PNX0H611013
Firmware Version:                   BXV77D0Q
PCI Vendor/Subsystem ID:            0x144d
IEEE OUI Identifier:                0x002538
Controller ID:                      1
Number of Namespaces:               1
Namespace 1 Size/Capacity:          512,110,190,592 [512 GB]
Namespace 1 Utilization:            254,982,533,120 [254 GB]
Namespace 1 Formatted LBA Size:     512
Local Time is:                      Mon Apr 17 17:45:48 2017 AEST
Firmware Updates (0x06):            3 Slots
Optional Admin Commands (0x0017):   Security Format Frmw_DL *Other*
Optional NVM Commands (0x001f):     Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat
Maximum Data Transfer Size:         32 Pages

Supported Power States
St Op     Max   Active     Idle   RL RT WL WT  Ent_Lat  Ex_Lat
 0 +     6.00W       -        -    0  0  0  0        5       5
 1 +     4.20W       -        -    1  1  1  1       30      30
 2 +     3.10W       -        -    2  2  2  2      100     100
 3 -   0.0700W       -        -    3  3  3  3      500    5000
 4 -   0.0050W       -        -    4  4  4  4     2000   22000

Supported LBA Sizes (NSID 0x1)
Id Fmt  Data  Metadt  Rel_Perf
 0 +     512       0         0

=== START OF SMART DATA SECTION ===
Read NVMe SMART/Health Information failed: NVMe Status 0x2002

Alguma ideia de por que esse problema pode estar ocorrendo e como posso resolvê-lo? Obrigado! :)

    
por Ben B 17.04.2017 / 10:26

3 respostas

13

Como apontado no comentário do Elder Geek , isso se deve a um bug conhecido .

Do relatório de erros:

  

O suporte APST acabou de chegar ao kernel mais recente do Zesty (4.10.0-14.16) como   parte do link .   Esse patch tem um capricho para certas unidades Samsung de 256GB encontradas na Dell   laptops que não se comportam bem quando o APST está ativado. Eu estou experimentando os mesmos sintomas com o mesmo modelo de laptop, exceto com uma Samsung de 512GB. Antes de desabilitar manualmente o APST, a unidade morreria e o sistema ficaria em chamas com erros de E / S dentro de 20 a 40 minutos após o boot.

Até que uma correção adequada seja implementada, uma solução alternativa é sugerida, o que envolve adicionar um parâmetro do kernel :

  

Por favor, tente nvme_core.default_ps_max_latency_us=5500 , se   o problema persistir, por favor, tente    nvme_core.default_ps_max_latency_us=200 .

Para adicionar um parâmetro de inicialização do kernel, edite o arquivo de configuração para o GRUB:

sudo nano /etc/default/grub

Encontre a linha que começa com GRUB_CMDLINE_LINUX_DEFAULT e adicione o parâmetro de inicialização aos outros já entre as aspas. Por exemplo, neste caso você provavelmente acabará com

GRUB_CMDLINE_LINUX_DEFAULT="quiet splash nvme_core.default_ps_max_latency_us=5500"

Salve o arquivo, saia e efetue a alteração, execute

sudo update-grub 
    
por Ben B 18.04.2017 / 08:45
0

Primeiro, eu visitei o site de suporte da Samsung e assegure que você tenha o firmware mais recente instalado para o modelo SSD.

Então, seu fsck não fez muito sentido, então faça assim ...

Para verificar o sistema de arquivos na sua partição do Ubuntu ...

  • inicialize no menu GRUB
  • escolha Opções avançadas
  • escolha o modo de recuperação
  • escolha Acesso raiz
  • no prompt #, digite sudo fsck -f /
  • repita o comando fsck se houver erros
  • digite reboot
por heynnema 17.04.2017 / 16:27
0

Uma solução possível para o bug conhecido que mencionei que não consigo teste como eu não tenho o hardware NVMe em questão seria tentar inicializar o atual pacote diário de compilação do kernel mainline para sua arquitetura disponível aqui.

Espere! antes de sair para experimentar, devo enfatizar que, a menos que você esteja certo , sabe exatamente o que está fazendo e como recuperar de conseqüências não intencionais, é altamente recomendável backup.

Se você não sabe o que está fazendo e tem um backup atual, você pode encontrar mais informações sobre como construir o seu kernel aqui.

Nota: No caso de você desnatado a primeira frase, esta resposta é baseada em pesquisa, não testando. Se quebrar, restaure seu backup.

    
por Elder Geek 18.04.2017 / 15:09