Ubuntu 14.04 blk_update_request Erro de E / S no mesmo setor em todas as unidades com o ZFS

3

Estou executando o Ubuntu 14.04 com a versão do ZOL v0.6.5.4 :

root@box ~# dmesg | egrep "SPL|ZFS"
[   34.430404] SPL: Loaded module v0.6.5.4-1~trusty
[   34.475743] ZFS: Loaded module v0.6.5.4-1~trusty, ZFS pool version 5000, ZFS filesystem version 5

O ZFS é configurado no raidz2 em unidades Seagate SpinPoint M9T de 6x e 2TB de 2,5 ", com cache de leitura, desduplicação e compactação ativadas:

root@box ~# zpool status -v
  pool: bigpool
 state: ONLINE
config:

        NAME                                           STATE     READ WRITE CKSUM
        bigpool                                        ONLINE       0     0     0
          raidz2-0                                     ONLINE       0     0     0
            ata-ST2000LM003_HN-M201RAD_S37<redactedid> ONLINE       0     0     0
            ata-ST2000LM003_HN-M201RAD_S37<redactedid> ONLINE       0     0     0
            ata-ST2000LM003_HN-M201RAD_S37<redactedid> ONLINE       0     0     0
            ata-ST2000LM003_HN-M201RAD_S37<redactedid> ONLINE       0     0     0
            ata-ST2000LM003_HN-M201RAD_S37<redactedid> ONLINE       0     0     0
            ata-ST2000LM003_HN-M201RAD_S34<redactedid> ONLINE       0     0     0
        cache
          sda3                                         ONLINE       0     0     0

A cada poucos dias, a caixa será bloqueada e receberei erros como:

blk_update_request: I/O Error, dev sdh, sector 764218200
blk_update_request: I/O Error, dev sdf, sector 764218200
blk_update_request: I/O Error, dev sde, sector 764218200
blk_update_request: I/O Error, dev sdd, sector 764218200
blk_update_request: I/O Error, dev sdc, sector 764218432
blk_update_request: I/O Error, dev sdg, sector 764218200

smartctl mostra que os discos não estão gravando nenhum erro SMART e são todos discos relativamente novos. Eu acho estranho que todos eles estejam falhando no mesmo setor (com exceção do sdc). Consegui capturar uma captura de tela do terminal (não consigo fazer o ssh quando os erros começam):

erros do console

Talvez seja um controlador com falha ou um bug relacionado ao zfs?

    
por dymk 20.02.2016 / 22:11

1 resposta

0

Você tem um problema de controlador, cabeamento ou backplane. Observe como todas as unidades são afetadas ao mesmo tempo ...

Eu também alertaria contra o uso de deduplicação em uma configuração como essa, a menos que seja totalmente necessário.

    
por 20.02.2016 / 22:25

Tags