Você precisa fazer backup de cada nó, a menos que cada nó armazene 100% dos dados e, em seguida, você possa fazer o backup de apenas um nó.
Atualmente, temos 12 nós em execução no nosso cluster do Cassandra. Em última análise, mesmo que alguns dos nós desapareçam, ainda estamos funcionando. A paranoia em mim gostaria de fazer pelo menos um backup por dia e armazená-lo no Amazon S3. Minha pergunta é a seguinte:
Ao fazer o backup do Cassandra, é suficiente executar o backup a partir de um nó, ou preciso executar um script de backup de cada um dos 12 nós e enviar seu respectivo backup para o S3? Se em um ponto uma restauração é necessária, nós temos que fazer backup do backup de nós individuais ou existe uma maneira de "agregar" os backups (supondo que você precise levá-los de cada nó individualmente) em um grande processo de restauração? / p>
Um pouco confuso com a documentação. Só quero obter um processo de backup eficiente rolando no meu cluster do Cassandra.
Você precisa fazer backup de cada nó, a menos que cada nó armazene 100% dos dados e, em seguida, você possa fazer o backup de apenas um nó.
A maneira mais fácil de fazer o backup do Cassandra é fazer backup de cada nó. Eu usei o tablesnap antes para fazer isso automaticamente e é muito bom. Há também Priam da Netflix, mas eu não tentei pessoalmente. link