Reconfigurando diretórios de dados em um nó existente do Cassandra

2

Atualmente, estou executando uma caixa muito simples Cassandra de nó único com os arquivos de dados em um único disco. Estou prestes a adicionar alguns SSDs à caixa e pretendo adicionar cada SSD como outro diretório de dados ao arquivo cassandra.yaml. Se eu parar Cassandra, instale os SSDs, mova os arquivos de dados do drive mecânico (atual) para um dos SSDs e então adicione os diretórios SSD ao arquivo yaml e inicie o Cassandra novamente, ele irá automaticamente iniciar o balanceamento entre os dois. discos? Existe algum problema em relação à reconfiguração da configuração do disco e do espaço em disco que eu deveria estar ciente?

    
por Nathan Ridley 08.03.2012 / 16:33

1 resposta

1

Nas versões mais recentes do Cassandra (desde v1.1.0 IIRC) você pode escolher onde as famílias de colunas individuais são armazenadas no disco - então sim, você pode distribuir a carga de famílias de colunas específicas (e o log de transações) pelos seus SSDs.

Se você estiver adicionando os SSDs atrás de uma camada RAID (digamos que a distribuição do raid 0 - cassandra escreve em blocos de 32K, então blocos de 32k parecem uma boa escolha para o tamanho da faixa), então você se beneficiaria de ter que se preocupar um local e você obterá um aumento muito significativo na taxa de transferência e nas operações de E / S.

Sua abordagem para fazer o movimento também parece boa para mim.

Como um aparte, eu realmente gosto do ZFS para este aplicativo. Eu posso optar por ter mais armazenamento fornecido por ferrugem barata e, em seguida, acelerar as leituras, colocando um cache L2 ARC em SSDs e acelerar gravações, se necessário, colocando o ZIL em SSDs (menos relevante na minha experiência com cassandra). p>     

por 03.09.2012 / 11:39

Tags