Resolução do endereço IP na configuração do MultiDC do Cassandra

2

Temos um cenário para o qual estamos pensando em usar o apache Cassandra para implantação em nossas necessidades de armazenamento de dados. A configuração deve ser distribuída em vários datacenters em diferentes regiões (locais físicos). Com cada data center com vários nós. No entanto, podemos ter no máximo um endereço IP público para cada data center. Com nós dentro do data center se comunicando através de IP privado. Planejamos usar RF = 3 e OldNetworkTopologyStrategy para posicionamento de réplica.

1. Isso nos leva a questionar como a descoberta de nós ocorrerá e como o anel de Cassandra será formado entre vários datacenters?

  1. Como o particionamento de dados deve ser realizado neste cenário?

  2. Se os dados residirem no Data center 1 node 2 e a consulta de leitura for enviada para o Data center 2 node 1, assumindo que o DC2 não possui uma réplica local do que como a consulta de leitura será atendida? Esta é a nossa maior preocupação, pois não foram encontrados artigos relacionados a IPs públicos / privados para o cassandra.

Como no Cassandra, qualquer nó pode ser consultado quanto a dados e o mesmo vale para solicitações de gravação, a cassandra é nossa primeira escolha em ambientes que precisamos implantar.

    
por pankaj soni 25.04.2011 / 11:14

1 resposta

1

Você precisará configurar uma VPN; O Cassandra assume que cada nó pode se comunicar diretamente entre si (mesmo que execute gravações multi-CD eficientes, ou seja, envia apenas uma cópia para cada CD, onde um coordenador a encaminhará a outras, se necessário).

    
por 06.06.2011 / 14:20

Tags