Partição de troca danificada - como e o que fazer?


Eu precisava do GPartEd para formatar um cartão MicroSD (não confie tanto no Disk Utility quanto mais problemas parecem ocorrer com discos rígidos e cartões de memória que eu formatava com ele, do que com aqueles que eu formatado com GPartEd), e quase consegui um ataque cardíaco ... Há uma partição danificada no meu novo disco rígido (um pouco mais de 2 meses de idade)!
Felizmente foi apenas a minha partição SWAP, mas ainda assim ...

Eu gostaria de saber algumas coisas ...

  • Como descartar a possibilidade de falha de hardware.
  • Como isso pode acontecer se o problema não estiver relacionado ao hardware.
    • Eu só instalei o Linux uma vez neste computador (aguardei que o Ubuntu 12.04 fosse liberado), por isso não é uma partição SWAP que resta de uma instalação anterior.
  • O que pode ser a causa do dano no disco rígido físico.
    • O computador não caiu de uma mesa ou qualquer coisa ...
  • Como evitar isso no futuro, se possível.
  • Adicional : Se é normal que a leitura (e a escrita também, eu acho) a velocidade diminua significativamente ao longo de um minuto; e se não for, quais são algumas maneiras possíveis de analisar / corrigir o problema?

Não há problema se você não puder responder a todas as minhas perguntas.


É um benchmark somente de leitura .
A partição rotulada Windows contém uma instalação do Windows 7 que eu deveria precisar de algum tempo para escola, e eu usei antes do Ubuntu 12.04 foi lançado. Eu o iniciei algumas vezes depois que o Ubuntu 12.04 foi instalado (não sei se a verificação de disco do Windows pode causar algum dano às partições do Linux, mas sempre parece executar um checkdisk depois que eu mudei o layout da minha tabela de partições com um Linux aplicação como GPartEd). /dev/sda7 é a partição SWAP de que estou falando.

Acho que minha melhor opção agora é tentar inicializar um Live CD e formatar /dev/sda7 novamente? Não irá formatá-lo no meu sistema Ubuntu instalado.

por RobinJ 23.05.2012 / 14:39

Apenas um tiro no escuro, mas IMHO sua partição de swap não está danificado em tudo. Já vi discrepâncias entre fdisk e gparted e, é triste dizer, mas o fdisk está quase sempre certo.


#> cat /proc/meminfo | grep -i swap
SwapCached:        10632 kB
SwapTotal:       2094076 kB
SwapFree:        2053324 kB

você deve ver que o seu espaço de swap está realmente em uso (ou pelo menos eu espero que sim).

A explicação para essa partição "% não legível" /dev/mapper/cryptswap1 é que cryptswap1 é na verdade um espaço de troca criptografado mapeado, portanto, não há problema em ninguém entender o que está lá. Se você quiser desabilitá-lo, você pode olhar para este tópico: Como desabilitar o cryptswap?

Por último, mas não menos importante, o seu SMART status: à primeira vista (apenas observando a taxa de erro de leitura e a taxa de erro de busca), eu teria dito que sua unidade estava prestes a derreter. Mas, não, tudo bem, eu tenho uma unidade cujo SMART diz exatamente o mesmo. Vou postar a saída completa apenas para referência (tanto para mim quanto para os outros) para futuras visitas.

#> sudo smartctl --all /dev/sda
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.2.0-24-generic] (local build)
Copyright (C) 2002-11 by Bruce Allen,

Model Family:     Seagate Barracuda 7200.12
Device Model:     ST3250318AS
Serial Number:    9VM2R3AN
LU WWN Device Id: 5 000c50 015aa8d47
Firmware Version: CC35
User Capacity:    250,059,350,016 bytes [250 GB]
Sector Size:      512 bytes logical/physical
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   8
ATA Standard is:  ATA-8-ACS revision 4
Local Time is:    Sun May 27 18:03:03 2012 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
                    was completed without error.
                    Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                    without error or no self-test has ever 
                    been run.
Total time to complete Offline 
data collection:        (  617) seconds.
Offline data collection
capabilities:            (0x7b) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Suspend Offline collection upon new
                    Offline surface scan supported.
                    Self-test supported.
                    Conveyance Self-test supported.
                    Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                    General Purpose Logging supported.
Short self-test routine 
recommended polling time:    (   1) minutes.
Extended self-test routine
recommended polling time:    (  52) minutes.
Conveyance self-test routine
recommended polling time:    (   2) minutes.
SCT capabilities:          (0x103f) SCT Status supported.
                    SCT Error Recovery Control supported.
                    SCT Feature Control supported.
                    SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
  1 Raw_Read_Error_Rate     0x000f   118   099   006    Pre-fail  Always       -       196559365
  3 Spin_Up_Time            0x0003   097   097   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       320
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   067   060   030    Pre-fail  Always       -       6277671
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       517
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       158
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   099   000    Old_age   Always       -       41
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   065   065   045    Old_age   Always       -       35 (Min/Max 21/35)
194 Temperature_Celsius     0x0022   035   040   000    Old_age   Always       -       35 (0 12 0 0)
195 Hardware_ECC_Recovered  0x001a   052   045   000    Old_age   Always       -       196559365
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       72748156060552
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       968998393
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       939693204

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 1
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

E eu tenho outra unidade que parece mais "normal":

#> sudo smartctl --all /dev/sdc
smartctl 5.42 2011-10-20 r3458 [x86_64-linux-3.0.6-gentoo-goomba-test-3]
(local build)
Copyright (C) 2002-11 by Bruce Allen,

Model Family:     Western Digital Caviar Green (Adv. Format)
Device Model:     WDC WD20EARS-00MVWB0
Serial Number:    WD-WCAZA2437330
LU WWN Device Id: 5 0014ee 205473c89
Firmware Version: 51.0AB51
User Capacity:    2,000,398,934,016 bytes [2,00 TB]
Sector Size:      512 bytes logical/physical
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   8
ATA Standard is:  Exact ATA specification draft version not indicated
Local Time is:    Sun May 27 18:16:09 2012 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x84) Offline data collection activity
                    was suspended by an interrupting
command from host.
                    Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine
                    without error or no self-test has ever 
                    been run.
Total time to complete Offline 
data collection:        (37500) seconds.
Offline data collection
capabilities:            (0x7b) SMART execute Offline immediate.
                    Auto Offline data collection on/off
                    Suspend Offline collection upon new
                    Offline surface scan supported.
                    Self-test supported.
                    Conveyance Self-test supported.
                    Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                    General Purpose Logging supported.
Short self-test routine 
recommended polling time:    (   2) minutes.
Extended self-test routine
recommended polling time:    ( 255) minutes.
Conveyance self-test routine
recommended polling time:    (   5) minutes.
SCT capabilities:          (0x3035) SCT Status supported.
                    SCT Feature Control supported.
                    SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always  -       0
  3 Spin_Up_Time            0x0027   253   253   021    Pre-fail  Always  -       1233
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always  -       390
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always  -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always  -       0
  9 Power_On_Hours          0x0032   094   094   000    Old_age   Always  -       4988
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always  -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always  -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always  -       388
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always  -       33
193 Load_Cycle_Count        0x0032   135   135   000    Old_age   Always  -       197801
194 Temperature_Celsius     0x0022   119   109   000    Old_age   Always  -       31
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always  -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always  -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline -       0
199 UDMA_CRC_Error_Count    0x0032   200   199   000    Old_age   Always  -       451
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 1
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

E outro com algum erro "real", que no entanto ainda está vivo após vários meses de pequenas reclamações:

#> sudo smartctl --all /dev/sda
smartctl 5.42 2011-10-20 r3458 [x86_64-linux-3.0.6-gentoo-goomba-test-3] (local build)
Copyright (C) 2002-11 by Bruce Allen,

Model Family:     Seagate Maxtor DiamondMax 20
Device Model:     MAXTOR STM3160211AS
Serial Number:    6PT56QN7
Firmware Version: 3.AAE
User Capacity:    160,041,885,696 bytes [160 GB]
Sector Size:      512 bytes logical/physical
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   7
ATA Standard is:  Exact ATA specification draft version not indicated
Local Time is:    Sun May 27 18:33:59 2012 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
                    was completed without error.
                    Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                    without error or no self-test has ever 
                    been run.
Total time to complete Offline 
data collection:        (  430) seconds.
Offline data collection
capabilities:            (0x5b) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Suspend Offline collection upon new
                    Offline surface scan supported.
                    Self-test supported.
                    No Conveyance Self-test supported.
                    Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                    General Purpose Logging supported.
Short self-test routine 
recommended polling time:    (   1) minutes.
Extended self-test routine
recommended polling time:    (  54) minutes.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
  1 Raw_Read_Error_Rate     0x000f   102   087   006    Pre-fail  Always       -       4542948
  3 Spin_Up_Time            0x0003   095   095   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       1011
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       11
  7 Seek_Error_Rate         0x000f   089   060   030    Pre-fail  Always       -       846828717
  9 Power_On_Hours          0x0032   086   086   000    Old_age   Always       -       13126
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       1019
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   064   052   045    Old_age   Always       -       36 (Min/Max 22/37)
194 Temperature_Celsius     0x0022   036   048   000    Old_age   Always       -       36 (0 14 0 0 0)
195 Hardware_ECC_Recovered  0x001a   050   046   000    Old_age   Always       -       11583613
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   169   000    Old_age   Always       -       48
200 Multi_Zone_Error_Rate   0x0000   100   253   000    Old_age   Offline      -       0
202 Data_Address_Mark_Errs  0x0032   100   253   000    Old_age   Always       -       0

SMART Error Log Version: 1
ATA Error Count: 204 (device log contains only the most recent five errors)
    CR = Command Register [HEX]
    FR = Features Register [HEX]
    SC = Sector Count Register [HEX]
    SN = Sector Number Register [HEX]
    CL = Cylinder Low Register [HEX]
    CH = Cylinder High Register [HEX]
    DH = Device/Head Register [HEX]
    DC = Device Command Register [HEX]
    ER = Error register [HEX]
    ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 204 occurred at disk power-on lifetime: 5852 hours (243 days + 20 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  -- -- -- -- -- -- --
  84 51 2d 72 00 00 e0  Error: ICRC, ABRT 45 sectors at LBA = 0x00000072 = 114

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 3e 61 00 00 e0 00      00:01:52.203  READ DMA
  27 00 00 00 00 00 e0 00      00:01:52.133  READ NATIVE MAX ADDRESS EXT
  ec 00 00 00 00 00 a0 00      00:01:52.125  IDENTIFY DEVICE
  ef 03 42 00 00 00 a0 00      00:01:52.104  SET FEATURES [Set transfer mode]
  27 00 00 00 00 00 e0 00      00:01:46.941  READ NATIVE MAX ADDRESS EXT

Error 203 occurred at disk power-on lifetime: 5852 hours (243 days + 20 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  -- -- -- -- -- -- --
  84 51 2d 72 00 00 e0  Error: ICRC, ABRT 45 sectors at LBA = 0x00000072 = 114

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 3e 61 00 00 e0 00      00:01:45.519  READ DMA
  c8 00 02 5f 00 00 e0 00      00:01:45.511  READ DMA
  27 00 00 00 00 00 e0 00      00:01:45.503  READ NATIVE MAX ADDRESS EXT
  ec 00 00 00 00 00 a0 00      00:01:45.431  IDENTIFY DEVICE
  ef 03 42 00 00 00 a0 00      00:01:45.423  SET FEATURES [Set transfer mode]

Error 202 occurred at disk power-on lifetime: 5852 hours (243 days + 20 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  -- -- -- -- -- -- --
  84 51 00 60 00 00 e0  Error: ICRC, ABRT at LBA = 0x00000060 = 96

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 02 5f 00 00 e0 00      00:01:45.519  READ DMA
  27 00 00 00 00 00 e0 00      00:01:45.511  READ NATIVE MAX ADDRESS EXT
  ec 00 00 00 00 00 a0 00      00:01:45.503  IDENTIFY DEVICE
  ef 03 42 00 00 00 a0 00      00:01:45.431  SET FEATURES [Set transfer mode]
  27 00 00 00 00 00 e0 00      00:01:45.423  READ NATIVE MAX ADDRESS EXT

Error 201 occurred at disk power-on lifetime: 5852 hours (243 days + 20 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  -- -- -- -- -- -- --
  84 51 00 60 00 00 e0  Error: ICRC, ABRT at LBA = 0x00000060 = 96

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 02 5f 00 00 e0 00      00:01:44.035  READ DMA
  25 00 08 af 8a a1 e0 00      00:01:43.980  READ DMA EXT
  27 00 00 00 00 00 e0 00      00:01:43.972  READ NATIVE MAX ADDRESS EXT
  ec 00 00 00 00 00 a0 00      00:01:43.968  IDENTIFY DEVICE
  ef 03 42 00 00 00 a0 00      00:01:43.904  SET FEATURES [Set transfer mode]

Error 200 occurred at disk power-on lifetime: 5852 hours (243 days + 20 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  -- -- -- -- -- -- --
  84 51 00 b6 8a a1 e0  Error: ICRC, ABRT at LBA = 0x00a18ab6 = 10586806

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  25 00 08 af 8a a1 e0 00      00:01:44.035  READ DMA EXT
  25 00 06 41 8a a1 e0 00      00:01:43.980  READ DMA EXT
  27 00 00 00 00 00 e0 00      00:01:43.972  READ NATIVE MAX ADDRESS EXT
  ec 00 00 00 00 00 a0 00      00:01:43.968  IDENTIFY DEVICE
  ef 03 42 00 00 00 a0 00      00:01:43.904  SET FEATURES [Set transfer mode]

SMART Self-test log structure revision number 1

SMART Selective self-test log data structure revision number 1
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Para o que diz respeito ao benchmark de velocidade de leitura, acho que uma diminuição de velocidade ao longo do tempo é normal. Eu suspeito que mecanismos de cache fazem o disco parecer mais rápido na fase inicial do teste e mais lento no final. No entanto, vejo que a sua "pior" velocidade de leitura é de cerca de 80MB / s, muito acima da velocidade de leitura "melhor média" (cerca de 60MB / s), pelo que não me preocuparia com este aspecto.

por Avio 27.05.2012 / 18:50

(Pretendido como um comentário, mas muito grande ...)

O erro gparted é apenas que ele é incapaz de detectar o sistema de arquivos (leia-se: ele provavelmente está lendo os dados da partição e tentando detectar o tipo de sistema de arquivos).

fdisk está listando a tabela de partição, e a entrada diz que é uma partição swap (isso não tem nada a ver com o sistema de arquivos, é a entrada do tipo de partição na tabela de partição, fdisk não tente até autodetectar o tipo de sistema de arquivos).

A saída fdsik que você mostra menciona um dispositivo cryptswap , que, suponho, é uma camada de criptografia sobre a partição swap. Então isso significa que sua partição swap provavelmente está criptografada.

Se for esse o caso, gparted está lendo a própria partição swap, mas provavelmente encontrará apenas dados criptografados que não parecem ser nenhum sistema de arquivos utilizável nem uma partição swap, porque os dados são criptografados e só podem ser acessados (em sua forma clara e decriptografada) através desse cryptswap device.

E se a troca estiver em uso e os dados criptografados estiverem sendo descriptografados no dispositivo cryptswap , isso também significa que a partição está em uso, explicando o erro "dispositivo ou recurso ocupado".

Só para verificar se esse é o problema, você pode compartilhar a saída da execução em um terminal /sbin/swapon -s ? E talvez também o conteúdo de /etc/fstab ?

por njsg 27.05.2012 / 20:23