Armazenamento distribuído [fechado]

4

No meu Departamento Universitário, estamos prestes a atualizar os computadores do nosso laboratório de estudantes (cerca de 25 a 30 máquinas). As máquinas estarão executando o Linux.

Uma coisa sobre as novas máquinas é que elas têm discos rígidos enormes (1TB) (não os solicitamos, mas, de qualquer forma, hoje em dia você não consegue encontrar discos consideravelmente mais baratos!)

Atualmente, os diretórios iniciais dos usuários são armazenados em um servidor de arquivos central e montados via nfs.

Então a questão é, existe alguma maneira de podermos usar toda essa capacidade de disco? Eu pensaria sobre

  • expandindo nosso armazenamento de arquivos central ou
  • replicando os diretórios base para acesso mais rápido.

A questão principal é que não é garantido que as máquinas do laboratório estejam ativas o tempo todo.

Procurando por este site eu li sobre GlusterFS e AFS .

O GlusterFS parece ter muitos amigos e ser uma ótima solução de propósito geral.

E o AFS? Eu li que tem problemas de desempenho, alguma experiência com isso?

    
por nplatis 18.03.2013 / 13:05

2 respostas

6

Eu estive lá, não querendo "desperdiçar" o que parece ser um bom armazenamento. Não é "bom", é uma tarefa tola tentar usar esse armazenamento como qualquer coisa além de local. O sistema teria que manter uma cópia completa de tudo em cada máquina, já que nunca saberia qual máquina será ligada / desligada. Somente o tráfego de replicação causaria um impacto perceptível em sua rede.

Se você realmente quiser usar esses discos, retire-os das estações de trabalho (inicialize PXE nas estações de trabalho) e use os discos em uma SAN (há muitos motivos para usar discos de nível de consumidor em uma SAN também!)

    
por 18.03.2013 / 13:39
0

Você consultou o link do sistema de arquivos CEPH

Além disso, sobre o armazenamento em cache, se você realmente quer isso, - você pode tentar o CacheFS, aqui está um bom artigo sobre link

    
por 18.03.2013 / 19:18