Para sistemas corporativos diretos, há uma camada adicional na forma do adaptador de armazenamento (quase sempre uma placa RAID) na qual ainda existe outra camada de cache. Há muita abstração na pilha de armazenamento nos dias de hoje, e eu entrei em detalhes em uma série de blogs que fiz em
As placas RAID podem ignorar o cache em disco, algumas das quais permitem até mesmo alternar esse recurso no BIOS RAID. Esta é uma razão pela qual os Enterprise disks são Enterprise, o firmware permite tais coisas que as unidades de consumo (unidades especialmente 'verdes') não possuem. Esse recurso aborda diretamente o caso no qual você está preocupado: falha de energia com gravações não-concluídas. O cache da placa RAID, que deve ser bateria ou flashback, será preservado até que a energia retorne e essas gravações possam ser recomortadas.
Certos SSDs corporativos incluem um capacitor integrado com potência suficiente para confirmar o cache onboard antes de ser totalmente desligado.
Se você está trabalhando com um sistema com discos conectados diretamente à placa-mãe, há menos garantias. A menos que os próprios discos tenham a capacidade de confirmar o cache de gravação, uma falha de energia certamente causará uma perda. O sistema de arquivos xfs ganhou reputação por falta de confiabilidade devido à incapacidade de sobreviver apenas a isso Modo de falha; foi projetado para rodar em sistemas corporativos completos com capacidade de sobrevivência de armazenamento projetada.
No entanto, o tempo mudou e o XFS foi projetado para sobreviver a isso. Os outros principais sistemas de arquivos do Linux (bem como ntfs no Windows) já tinha engenharia para sobreviver a este modo de falha. Como isso deve funcionar é que as gravações perdidas não aparecerão no diário da FS e elas saberão que não foram afetadas, então a corrupção será detectada e contornada com segurança.
Você aponta para o único problema aqui: o firmware do disco que está. Neste caso, a revista FS terá feito uma suposição errada versus a realidade e a corrupção pode não ser detectada por algum tempo. O Parity RAID e o mirror RAID podem contornar isso, já que deve haver outra cópia comprometida. Mas as configurações de disco único não terão essa verificação cruzada, por isso, será realmente falha.
Você contorna o risco de firmware usando unidades de nível empresarial que obtêm muito mais validação (e são testadas em comparação com os padrões de carga de trabalho presumidos) e projetam seu sistema de armazenamento para que ele sobreviva a tais inverdades.