ext4 fs quebra após quedas de energia

3

Estou com um problema típico, mas estranho: o disco rígido está falhando após cortes de energia no meu servidor. Eu posso sentir o enorme trabalho feito pelo fsck na inicialização após o travamento, e então meu repositório do subversion está perdendo meses de trabalho - tudo soa estranho para mim. O servidor está executando o ext4 no disco rígido, por isso é suposto ser seguro - mas não é. Estou começando a suspeitar de um problema no disco rígido, mas talvez possa haver outras causas?

A linha relevante fstab é

/dev/mapper/vg_data-LV_data /data ext4 defaults 1 2

e o sistema é o Fedora 11 x86_64.

    
por Michael Pliskin 01.07.2010 / 12:27

2 respostas

8

Independentemente das afirmações que qualquer sistema de arquivos faz sobre ser resiliente a shutdowns sujos, nunca permitiria que um computador servidor de produção fosse executado sem proteção de energia. Em minha opinião, há muitas camadas potenciais de armazenamento em cache e muita abstração para que o SO tenha absoluta certeza de que os dados realmente estão comprometidos (mesmo quando o subsistema de disco afirma que é).

Não está claro para mim se o Fedora 11 enviado com o bug de alocação atrasado ext4 corrigido ou não. Parece que sim, mas a formulação do FAQ não é 100% clara (e eu não tenho tempo para examinar o kernel SRPM para o Fedora 11 agora).

Como plano de fundo: O kernel 2.6.30 mudou o comportamento padrão do ext4 para não usar alocação atrasada. Antes de 2.6.30, esse comportamento de alocação atrasada estava em vigor por padrão e poderia causar perda de dados se a energia fosse perdida antes que as operações de disco fossem confirmadas. (Referência no link e link e plano de fundo em link ).

Certifique-se de estar executando o kernel mais atualizado para o Fedora 11 e, se possível, pare de permitir que o sistema de arquivos seja derrubado com força.

    
por 01.07.2010 / 12:43
3

Dependendo de quão sofisticada é sua configuração do LVM, o problema pode ser que o LVM desconsidere as barreiras de E / S. Barreiras em dispositivos lineares simples devem funcionar a partir de 2.6.30 (que você parece ter), mas as coisas mais complicadas devem funcionar a partir de 2.6.33.

    
por 05.09.2010 / 22:11