Erro ext2-fs que aparece mensalmente ou às vezes semanalmente

2

Eu tenho uma mensagem de erro extremamente estranha, que causa uma falha completa do sistema e a remontagem do sistema de arquivos como somente leitura. Tudo começou há muito tempo quando eu instalei um modesto PCI $ 2 ebay e houve panes de kernel aparecendo mensalmente e a saída foi enorme. Um novo disco rígido e um dist-upgrade mais tarde consegui que o erro seja muito esporádico e muito menor em termos do que é realmente impresso. (ainda é um lixo para mim - mesmo depois de pesquisar no google)

Este sistema quando inicializado no Debian foi 'amaldiçoado' Eu estava pensando em destruir o computador e obter um novo ... mas como é apenas um problema do Linux, ele deve ser um software !!

Basicamente aqui está (eu posto agora porque eu caí hoje, mas também ontem):

EXT2-fs error (device hda1): ext2_check_page: bad entry in directory #5898285: rec_len is smaller than minimal - offset=0, inode=5898285, rec_len=8, name_len=1 Remounting filesystem read-only

O que está acontecendo? Eu então tenho que puxar o poder para fora, reiniciar, fsck -y, reiniciar e, em seguida, que geralmente resolve por um tempo.

Se isso pudesse ser descoberto, eu ficaria muito feliz.

Obrigado antecipadamente por qualquer luz que vocês possam lançar sobre esse assunto.

- EDITAR:

Agora, executar updatedb causa esse erro toda vez (bem duas vezes) e isso significa que é reproduzível e rastreável! (agora só para consertar isso ...)

É hora de um novo computador?

- EDITAR:

resize2fs /dev/hda1 diz que já é a quantidade correta de blocos longos e os badblocks não retornam nada (não é para isso?)

- EDITAR:

É possível que algo esteja corrompendo todos os meus novos discos? Um problema de hardware - alguém disse que poderia ser o controlador de disco, ou uma opção de bios - está lá de qualquer maneira para verificar isso?

Obrigado.

    
por Dennis Williamson 16.08.2009 / 01:57

2 respostas

2

Isso realmente parece que a idéia do sistema de arquivos do tamanho da partição é diferente do tamanho real da partição. Você disse que instalou um novo disco rígido; Se você transferiu o sistema de arquivos para o novo disco rígido com o dd (ou algum outro método que não envolvesse um mkfs no novo disco) isso poderia acontecer.

Tente executar resize2fs /dev/hda1 de dentro de um ambiente de recuperação (após fsck -f , etc) e veja se o tamanho do sistema de arquivos é alterado. Eu estou supondo que provavelmente irá, e seus problemas vão desaparecer misteriosamente.

    
por 16.08.2009 / 02:10
1

Eu certamente acho que seu disco contém setores defeituosos. Você pode verificar isso com badblocks ( link )

man badblocks:

badblocks  is  used  to  search  for bad blocks on a device
(usually a disk partition).  device is the special file corresponding
to the device (e.g /dev/hdc1).  last-block is the last block to be checked; 
if it is not specified, the last block on the device is used as a default. 
start-block is an optional parameter specifying the starting block number
for the test, which allows the  testing to start in the middle of the disk.
If it is not specified the first block on the disk is used as a default.

se você realmente quiser terminar, você deve escolher a opção -w (teste de leitura-escrita) com 2-3 passagens, mas certifique-se de fazer backup dos dados porque os testes de leitura / gravação são destruindo dados na mídia física.

NOTA: você será tentado a configurar o ext * para ignorar blocos defeituosos, mas recomendo enfaticamente substituir a unidade. As unidades geralmente contêm alguns blocos defeituosos por padrão, mas a lógica interna realoca os dados em tempo real, se o sistema operacional desejar gravar em um bloco inválido conhecido. A área para essa realocação é fixa, portanto, se ela ficar cheia, a unidade parará de realocar os setores. Este é o ponto em que você está agora, então você pode esperar que os setores se tornem defeituosos cada vez mais rapidamente. Se você tem alguma garantia em seu disco, você deve obter o disco substituído, se não, obter um novo.

Você também pode considerar a configuração de um RAID1 (a partir de novos discos) e a criação de backup em intervalos regulares (para mídias de disco não armazenadas no ou próximo do servidor / estação de trabalho no tópico)

NOTA2: embora um problema de memória não se manifeste estritamente nos mesmos erros o tempo todo, você também pode rodar um memtest para ter certeza de que seu servidor não tem "Alzheimer":)

    
por 16.08.2009 / 10:27