Em geral, é necessário configurar uma ferramenta especial que monitore o ataque ao hardware dentro do sistema, mas as ferramentas são diferentes para diferentes fornecedores, por exemplo, servidores dell têm omsa, hp tem seu próprio material e assim por diante e no final eles precisam ser configurados para e-mails, traps e assim por diante. Também existem ferramentas de controlador (megacli que podem verificar o status dos discos e ataques de hardware. também a maioria dos servidores tem indicadores de luz que podem mostrar que algo deu errado com os discos. a substituição é principalmente automática, você puxa o disco quebrado, insere um novo com o mesmo tamanho / velocidade ... e orar para que durante a reconstrução não sejam afetados outros discos:)
a substituição de disco md (software-raid) pode envolver um pouco mais de etapas, mas eu nunca substitui nenhum disco de raid de software até agora ...