Random falha na minha máquina do servidor WIndows

1

Esta semana estou recebendo falhas aleatórias curiosas em uma das minhas máquinas Windows. Crash sempre termina com BSOD, mas com códigos de erro aleatórios em drivers aleatórios do sistema. Nenhum registro no log de eventos.

Então, o primeiro palpite é a memória, mas percebi que há apenas um disco SSD dentro. Eu não confio em nenhum dado SMART dos discos, mas desta vez talvez seja esse o caso quando eu deveria. O que você acha? O auto-teste do disco com a magia Parted foi ok. Eu não posso me dar ao luxo de fazer o teste de gravação.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   120   120   050    Pre-fail  Always       -       0/0
  5 Retired_Block_Count     0x0033   100   100   003    Pre-fail  Always       -       0
  9 Power_On_Hours_and_Msec 0x0032   095   095   000    Old_age   Always       -       4581h+05m+42.650s
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       290
171 Program_Fail_Count      0x0032   000   000   000    Old_age   Always       -       0
172 Erase_Fail_Count        0x0032   000   000   000    Old_age   Always       -       0
174 Unexpect_Power_Loss_Ct  0x0030   000   000   000    Old_age   Offline      -       11
177 Wear_Range_Delta        0x0000   000   000   000    Old_age   Offline      -       1
181 Program_Fail_Count      0x0032   000   000   000    Old_age   Always       -       0
182 Erase_Fail_Count        0x0032   000   000   000    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
194 Temperature_Celsius     0x0022   128   129   000    Old_age   Always       -       128 (0 127 0 129 0)
195 ECC_Uncorr_Error_Count  0x001c   100   100   000    Old_age   Offline      -       0/0
196 Reallocated_Event_Count 0x0033   100   100   003    Pre-fail  Always       -       0
201 Unc_Soft_Read_Err_Rate  0x001c   100   100   000    Old_age   Offline      -       0/0
204 Soft_ECC_Correct_Rate   0x001c   100   100   000    Old_age   Offline      -       0/0
230 Life_Curve_Status       0x0013   100   100   000    Pre-fail  Always       -       100
231 SSD_Life_Left           0x0013   100   100   010    Pre-fail  Always       -       0
233 SandForce_Internal      0x0000   000   000   000    Old_age   Offline      -       1319
234 SandForce_Internal      0x0032   000   000   000    Old_age   Always       -       944
241 Lifetime_Writes_GiB     0x0032   000   000   000    Old_age   Always       -       944
242 Lifetime_Reads_GiB      0x0032   000   000   000    Old_age   Always       -       1317


Model Family:     SandForce Driven SSDs
Device Model:     Corsair Force 3 SSD
    
por John 29.12.2012 / 22:58

3 respostas

1

Eu tenho isso pessoal. Há um bug enorme nesses SSDs em relação ao modo de suspensão. Se o disco entrar no modo de suspensão, às vezes pode haver um problema para despertá-lo, pois ele ignora a instrução COM_WAK. Não sei por que começou a fazer isso agora, talvez tenha sido causado pela atualização do Windows.

No entanto, eu atualizei todos os firmwares do sistema e depois de atualizar o firmware dos discos para 5.3, as falhas estão ausentes.

    
por 03.01.2013 / 23:17
1

Pelo menos, criou um despejo de memória? Caso contrário, verifique se o seu sistema está configurado para criar despejos de memória, espere que isso aconteça novamente e use o Windbg para revisar o arquivo memory.dmp.

    
por 29.12.2012 / 23:58
0
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
194 Temperature_Celsius     0x0022   128   129   000    Old_age   Always       -       128 (0 127 0 129 0)

Hum, supondo que isso seja realmente exato, o problema é que seu computador está ficando quente o suficiente para ferver água. Então, o que você precisa fazer é investir em uma chaleira adequada para suas necessidades de água fervendo e manter seu computador muito mais frio, em vez de usá-lo para gerar vapor.

    
por 30.12.2012 / 00:36