XenServer Linux guest inicializando o iSCSI SAN (armazenamento do ZFS): Um sistema de arquivos guest sem verificação de soma ainda estará em risco?

4

Estamos armazenando arquivos no FreeNAS 9.2 usando o ZFS. Eu adoro as declarações de integridade de dados feitas pelo ZFS, tendo perdido dados aleatoriamente no passado em servidores que usam ext3, XFS e ReiserFS que não foram maltratados (falta de energia, etc). Era raro, mas desastroso quando um servidor precisava de uma reinicialização, o fsck entrava em ação e encontrava muitos erros.

Também estamos usando esse mesmo NAS como um destino de armazenamento compartilhado para máquinas virtuais XenServer. No começo eu estava pensando em como é bom ter nossas máquinas virtuais com o ZFS, mas agora estou duvidando que a integridade seja realmente uma prova de falha.

Se o disco virtual de uma VM for apenas um arquivo grande contendo seu próprio sistema de arquivos (assuma o padrão recomendado ext4), o que impede que ele se torne corrompido dentro desse disco virtual? Talvez um cabo de rede esteja com defeito e o iSCSI não saiba que recebeu alguns bytes inválidos para armazenar (resilientemente no ZFS)? Eu estou supondo que existem outras falhas possíveis que podem ocorrer entre a VM e o armazenamento compartilhado que um sistema de arquivos "confiante" não detectaria. A única solução também é usar um sistema de arquivos de correção de erros dentro da VM, como ZFS ou btrfs?

    
por jimp 19.01.2014 / 23:02

1 resposta

4

Desculpe, nada impede que isso aconteça em seus convidados.

Proteja seu ambiente!

  • Use fontes de alimentação ininterruptas para fazer backup de seu servidor e hardware de rede.
  • Fontes de alimentação duplas em tudo que você pode.
  • Vários caminhos de armazenamento (MPIO para o iSCSI no seu caso).
  • Backups.

E, mesmo os VM sistemas de arquivos ZFS podem ter problemas.

Every 3.0s: zpool status -v                                                                                                                                                                                    Fri Dec 27 12:49:47 2013

  pool: vol1
 state: ONLINE
status: One or more devices has experienced an error resulting in data
        corruption.  Applications may be affected.
action: Restore the file in question if possible.  Otherwise restore the
        entire pool from backup.
   see: http://zfsonlinux.org/msg/ZFS-8000-8A
  scan: scrub in progress since Fri Dec 27 12:35:06 2013
    42.1G scanned out of 46.3G at 48.9M/s, 0h1m to go
    0 repaired, 90.80% done
config:

        NAME        STATE     READ WRITE CKSUM
        vol1        ONLINE       0     0   167
          sdb       ONLINE       0     0   448

errors: Permanent errors have been detected in the following files:

        <metadata>:<0x67>
        <metadata>:<0x6f>
        <metadata>:<0x8e>
        vol1/ppro:/isam/IM00013.ISI
        vol1/ppro:/isam/IM00014.ISI
        vol1/ppro:/isam/IM00015.ISI
        vol1/ppro:/isam/IM00016.ISI
    
por 19.01.2014 / 23:12