Eu irei o segundo aviso de SvenW sobre falhas silenciosas; se alguma coisa, é um pouco bom demais para sobreviver a uma falha na unidade. Eu vi o resultado de um par de servidores que tiveram uma unidade desistir de um espelho de software por algum motivo (eu suspeito que não venha pronto a tempo depois de uma reinicialização); tudo funciona bem com o drive restante até que, vários meses depois, algo dá errado com o THAT drive - e ele volta para a unidade que deu um erro pela primeira vez, e os últimos meses desapareceram.
Aqui está um pequeno script de shell que eu preparei para corrigir isso. Substitua em seu endereço de e-mail, salve-o como algo como /etc/periodic/daily/150.check-raid, torne-o executável e ele deverá enviar um aviso para você (às 3:15 da manhã seguinte) se o ataque for degrada. Para testá-lo (strongmente recomendado no caso de bloqueios de spam, etc), conecte algumas unidades descartáveis (unidades de chaves USB, o que for), espelhe-as, desconecte uma, deixe a outra durante a noite e veja se você tem um aviso em sua caixa de correio de manhã.
#!/bin/sh
# This script checks for any degraded/offline/failed/whatever software
# RAIDs, and if any are found emails a note to an admin. To use it,
# replace the ADMIN_EMAIL value with your own email address, drop it in
# /etc/periodic/daily, and change the owner to root. This'll make it
# run its check every morning at 3:15am.
#
# Warning: this script doesn't check anything other than software RAIDs
# built with the Apple (i.e. Disk Utility) RAID tools. It does not check
# any hardware RAIDs (including Apple's RAID card), or even any third-party
# software RAIDs. If "diskutil listraid" doesn't list it, it's not going
# to be checked.
#
ADMIN_EMAIL="[email protected]"
if diskutil listraid | grep "^Status:" | grep -qv "Online$"; then
diskutil listraid | mail -s 'RAID problem detected' "$ADMIN_EMAIL"
fi