Servidor NFS gerando “extensão inválida” no disco do sistema EXT4?

1

Eu tenho um servidor rodando o Xen 4.1 com o Oneiric no dom0 e cada um dos 4 domUs. Os discos do sistema dos domUs são volumes LVM2 construídos sobre um RAID1 mdadm.

Todos os discos do sistema domU são EXT4 e são criados usando instantâneos do mesmo modelo original. 3 deles rodam perfeitamente, mas um (chamado s-ub-02) continua sendo remontado como somente leitura. Um e2fsck subsequente resulta em um único diagnóstico de "extensão inválida":

e2fsck 1.41.14 (22-Dec-2010)
/dev/domu/s-ub-02-root contains a file system with errors, check forced.
Pass 1: Checking inodes, blocks, and sizes
Inode 525418 has an invalid extent
    (logical block 8959, invalid physical block 0, len 0)
Clear<y>? yes

Pass 2: Checking directory structure
Pass 3: Checking directory connectivity
Pass 4: Checking reference counts
Pass 5: Checking group summary information
/dev/domu/s-ub-02-root: 77757/655360 files (0.3% non-contiguous), 360592/2621440 blocks

O console mostra tipicamente os seguintes erros para o disco do sistema (xvda2):

[101980.903416] EXT4-fs error (device xvda2): ext4_ext_find_extent:732: inode #525418: comm apt-get: bad header/extent: invalid extent entries - magic f30a, entries 12, max 340(340), depth 0(0)
[101980.903473] EXT4-fs (xvda2): Remounting filesystem read-only

Eu criei novas versões do disco do sistema. A mesma coisa sempre acontece. Isso, e o fato de que o disco está no final em um RAID1, me leva a impedir um erro de disco de hardware.

A única característica distintiva óbvia deste domU é a presença de nfs-kernel-server , então eu suspeito disso. Seu arquivo exports é assim:

/exports/users           192.168.0.0/255.255.248.0(rw,sync,no_subtree_check)
/exports/media/music     192.168.0.0/255.255.248.0(rw,sync,no_subtree_check)
/exports/media/pictures  192.168.0.0/255.255.248.0(rw,sync,no_subtree_check)
/exports/opt             192.168.0.0/255.255.248.0(rw,sync,no_subtree_check)

/exports/users e /exports/opt são volumes LVM2 do mesmo grupo de volumes que o disco do sistema. /exports/media é um volume EXT2. (Há um problema em que os clientes vêem /exports/media/pictures como sendo um volume somente leitura, o que eu menciono por completo).

Com exceção do problema de somente leitura, o servidor NFS parece funcionar corretamente sob carga leve por várias horas antes que ocorra o problema de "extensão inválida".

Não há entradas úteis em /var/log . De repente, não há mais arquivos sendo gravados, portanto, é possível ver quando o disco foi remontado como somente leitura, mas não há indicação de qual poderia ser a causa.

Alguém pode me ajudar com esse problema?

Steve

    
por Stephen Winnall 04.01.2012 / 14:59

1 resposta

2

Este problema foi resolvido pelo OP:

  

Eu finalmente resolvi esse problema descartando o ext4 e voltando ao ext3   depois que o ext4 começou a tocar novamente. Há algo estranho acontecendo   nessa VM em particular, mas não posso gastar mais tempo tentando   descubra o que é isso.

    
por coversnail 24.04.2012 / 19:57