Reduza o risco de corrupção de dados devido à perda de energia

1

Atualmente, temos vários servidores em locais onde a energia geralmente é interrompida por vários motivos. Todos os servidores executam o ESX com alguns convidados linux. Colocar o UPS aqui não é prático ainda, então estou procurando algumas maneiras pelas quais podemos reduzir nosso risco de corromper os sistemas de arquivos.

Eu olhei originalmente para controladores RAID (não especificamente para redundância de disco), mas eu li que usar recursos como o cache pode realmente aumentar o risco de perda de dados. Parece também que os controladores com baterias de cache podem ajudar, mas não estou totalmente convencido.

Alguém sabe se as placas controladoras RAID realmente fornecem esse tipo de proteção ou se há alguma outra coisa que possamos fazer para reduzir nosso risco?

    
por Chris Edgington 30.03.2017 / 12:57

3 respostas

5

Os controladores de armazenamento podem vir com um Cache de gravação com bateria e / ou supercap (icitor) no caso de SSDs para proteger gravações em cache durante quedas de energia.
De fato, há situações em que elas ainda não protegerão a integridade de seus dados, embora o BBWC forneça melhor proteção do que usar um cache de gravação sem bateria, desabilitando completamente todos os caches de gravação (ao custo de algum desempenho) pode ser mais confiável.

Mas a ferramenta recomendada ainda é um no-break, pois mesmo um pequeno permitirá que os sistemas façam um desligamento normal quando, durante uma queda de energia, as baterias estiverem quase esgotadas (além de proteger o hardware contra picos repetidos de energia ).

    
por 30.03.2017 / 13:36
1

Controladores RAID com BBU podem às vezes reduzir o risco de erros no sistema de arquivos quando um desligamento não é grato aconteceu. Às vezes porque você não pode garantir que o sistema operacional em seus sistemas de arquivos não seja eliminado enquanto estiver gravando algum bloco em seu disco para que o sistema operacional se torne inutilizável (não necessariamente o sistema de arquivos). Enquanto isso, eu investiria em alguns UPSs (muito pequenos), como isso , para que os servidores possam fazer um desligamento normal sempre que ocorrer uma queda de energia.

Edit: Bem, @HBruijn me bateu para ele:)

    
por 30.03.2017 / 13:41
1

Tendo um único host com um único RAID com cache de write-back ativado, algum dia, com certeza, seria um problema de corrupção de dados.

Dê uma olhada na solução de armazenamento definida por software que fornece = 2 falhas de tolerância (2+ cópias de seus dados armazenados). Ter um cluster de nós onde cada um tem uma conexão com o UPS e o armazenamento compartilhado fornecido no topo do RAID 10/6 provavelmente reduziria a corrupção de dados a nenhum deles. Obviamente, duas linhas de energia independentes devem ser conectadas ao no-break. Com esse tipo de configuração, você pode ativar / usar o cache com certeza.

    
por 04.05.2017 / 21:53