A replicação de SAN para SAN é a sua melhor opção para colocar o servidor de arquivos on-line o mais rápido possível, com um pouco de perda após declarar um desastre. Observe que esse tipo de proteção contra DR não protege das mesmas coisas que os backups locais; você não pode usar um volume SAN replicado para, por exemplo, desfazer a exclusão de um arquivo do mês anterior.
Os arquivos corrompidos não são um perigo de replicação de SAN para SAN, a menos que seja o servidor de arquivos no site principal que os corrompe. Cada SAN que fornece replicação de armazenamento baseado em blocos (LUNs) tem algum mecanismo para impedir a corrupção e garantir a consistência. É um problema mais complicado do que a maioria das pessoas sabe, porque as gravações costumam ser aplicadas ao disco fora de ordem, mesmo sem replicação, por motivos de otimização. É por isso que o cache de gravação para a maioria dos armazenamentos possui algum tipo de rede de segurança contra falhas de energia (como uma bateria ou um no-break): sem as gravações salvas apenas no cache, o disco subjacente provavelmente está corrompido. Normalmente, tudo bem, no entanto, se você perder a energia, é necessário garantir que a última gravação reconhecida pelo armazenamento seja salva no disco para tornar o disco consistente quando for exibido.
A replicação trata isso de forma diferente, dependendo de como você está replicando:
- A replicação síncrona garante a consistência porque não retornará uma confirmação de gravação para o servidor local até obter confirmação de que a gravação foi feita com segurança para o site secundário. Isso retarda as gravações consideravelmente, e nenhum fornecedor suporta fazer isso em nada menos que uma conexão estelar de distância relativamente baixa. Na verdade, a distância suportada é geralmente tão baixa que você fica vulnerável aos mesmos furacões. É raro ver e geralmente não é a única coisa no lugar.
- Replicação de ponto de verificação assíncrona é de longe o algoritmo mais comumente visto, usado pela grande maioria do armazenamento de sistema aberto. Periodicamente, a caixa replicará um ponto de verificação consistente, o que significa que garantirá que a cópia recuperável encontrada no sistema remoto não tenha gravações ausentes. Se for interrompido no meio de um checkpoint, ele será descartado e irá para o último ponto consistente conhecido. Eu vi sistemas que, desde que sua WAN suporte, você pode ter um ponto de recuperação de 15 segundos usando este método.
- A replicação de entrega assíncrona por ordem é mais rara e difícil de fazer do que o ponto de verificação, mas na minha opinião é o melhor em termos de algoritmos de assincronização. O que ele faz é enviar as gravações pela WAN na ordem em que são feitas. O problema é que, ao contrário da replicação de ponto de verificação, se isso ficar para trás, o armazenamento usado para manter as gravações não enviadas não pode ser liberado sem exigir uma ressincronização completa (reenviando todos os dados). Geralmente, se o link não conseguir acompanhar as gravações, ele voltará ao modo de ponto de verificação e começará a fazer a entrega por ordem novamente assim que tiver um ponto de verificação recente. O ponto de recuperação da EMC e o HUR da Hitachi fazem isso, no entanto, não vi outros fornecedores configurados dessa maneira.
Todos esses mecanismos fornecem "consistência de falhas". O disco está no mesmo estado em que ficaria se você desligasse o computador abruptamente. Demora um pouco de trabalho para obter sistemas de arquivos e bancos de dados em execução a partir de uma cópia consistente, mas é sempre factível. Se você quiser algo mais (que "nível mais alto" você menciona na pergunta), você precisa integrar sua replicação com seus aplicativos. Isso normalmente significa pausar gravações no aplicativo, aguardar até que tudo tenha sido destinado ao armazenamento e, em seguida, iniciar um ponto de consistência para replicação. Isso é chamado de "consistência de aplicativo". Ele geralmente fornecerá um ponto de recuperação um pouco mais antigo, mas um tempo de recuperação um pouco menor do que a consistência de falhas.