Mesmo arquivo com conteúdo diferente em cada leitura [fechado]

2

Eu tenho um problema com um sistema de arquivos aqui em uma máquina de armazenamento. Percebemos que muitos dos dados que saem dos sistemas parecem corruptos, mas apenas com pequenos problemas, como erros de CRC com instaladores de auto-verificação ou pequenos erros de imagem nos filmes. Enquanto rastreio o problema, eu finalizo em um teste com 3 arquivos com cerca de 900MB cada. O sistema de arquivos ext4 é montado somente para leitura , mas toda vez que eu faço um md5sum nos arquivos, o resultado é diferente:

$  ls -l
-rw-rw-r-- 1 samba samba 922789695 Jan  7 21:47 File1
-rw-rw-r-- 1 samba samba 939080225 Jan  7 21:54 File2
-rw-rw-r-- 1 samba samba 996515494 Jan 14 21:13 File3

$  md5sum *
9449c8e4fd2869a7969017db266451b0  File1
016b5c2e8b535ec922f5efb4ec9082bc  File2
5576aeb34575e07171fa835a79fec147  File3
$  echo 3 > /proc/sys/vm/drop_caches # (clear file cache of the kernel)
$  md5sum *
3f03edec64e22de384fd3d2cff0e3730  File1
32b53ee1dd3f5c9796322cabe4f8c0da  File2
35af5c433d0725ab0892d4517faeceea  File3
$  echo 3 > /proc/sys/vm/drop_caches
$  md5sum *
593d83e084387a8d5bd9b445032a5669  File1
4f8b76249b96a1a29bdd748167c41bda  File2
8b5bab8a153eb6e33dc3cd7d23362090  File3
$  echo 3 > /proc/sys/vm/drop_caches
$  md5sum *
d716d9c4acbd3ade450bab46903810d9  File1
68ede84d1396075ffe8a9228966cc148  File2
b8d75123b2d5b18c0d2827a448f53086  File3
$  echo 3 > /proc/sys/vm/drop_caches
$  md5sum *
c991bcca3bc2f39fdd143f8460935646  File1
73e6301b28c3b1b0bb95df52ea5794dd  File2
a202e88343d6e7bc4dce808b885ad013  File3

Primeiro, deixo o e2fsck verificar todo o disco. Ele encontrou alguns problemas, mas encontrou outros erros em cada nova execução. Eu acho que tem outras leituras sempre que md5sum e o problema está em outra camada. A coisa toda está dentro de um xen vm, mas não acho que detalhes sejam importantes.

A arquitetura é como:

ext4
 |
dm-crypt
 | (xen blk between here)
md-raid5 (softraid)
 |
 +---+-----------------------------+
     |                             |
mainboard sata         +---------pcie---------+
     |                 |                      |
  3 disks         sata controller(jbod)   sata controller(jbod)
 (1 failed)            |                      |
                    2 disks                2 disks

saída lspci dos controladores sata:

00:12.0 SATA controller: Advanced Micro Devices [AMD] nee ATI SB600 Non-Raid-5 SATA
02:00.0 RAID bus controller: Silicon Image, Inc. SiI 3132 Serial ATA Raid II Controller (rev 01)
03:00.0 SATA controller: JMicron Technology Corp. JMB363 SATA/IDE Controller (rev 03)

Enquanto eu estava procurando o problema, um dos 7 discos falhou e a invasão está sendo executada com apenas 6 discos até que a substituição chegue. Talvez isso possa ser parte do problema? Existia definitivamente antes do fracasso, mas agora o ataque deveria estar em um estado vulnerável mas estável ...?

O que está acontecendo aqui?

    
por a4c8b 24.01.2014 / 22:19

1 resposta

0

Eu acho que encontrei o problema: Depois de um tempo de conexão entre diferentes configurações eu substituí o controlador SiI por um velho PCI eo problema parece estar resolvido.

    
por 25.01.2014 / 12:16