A única coisa que você não fez, até onde eu sei, é trocar novos discos no card suspeito de mau. Não tente fazer isso com dados importantes, mas clonar os dados reais em alguns discos sobressalentes (em outra máquina, seguido de um cheque para pegar uma sobra ruim) é provavelmente razoável. (Você tem discos de reposição por aí, certo?)
A hipótese aqui é que uma recorrência do problema demonstra que não são os discos em falta.