Glusterfs 2x problema no servidor

1

Estou tendo um problema quase idêntico, enquanto isso pode fornecer mais detalhes sobre como a configuração é:

2x server replica 2 gluster volume from two bricks. Brick IMG-01:/images/storage/brick1 49152 0 Y
3497 Brick IMG-02:/images/storage/brick1 49152 0
Y 3512 NFS Server on localhost N/A
N/A N N/A Self-heal Daemon on localhost
N/A N/A Y 3490 NFS Server on IMG-02
N/A N/A N N/A Self-heal Daemon on IMG-02
N/A N/A Y 3505 Task Status of Volume gv1 ------------------------------------------------------------------------------ There are no active volume tasks

Para permitir o HA, fiz isso do lado do Gluster-clients:

   IMG-01:/gv1  /mnt/glustervol1 glusterfs  _netdev,backupvolfile-server=IMG-02,direct-io-mode=disable,log-level=WARNING,log-file=/var/log/gluster.log  0    0

A versão do Glusterfs-server é 3.7 no Ubuntu 16.04 e os clientes são glusterfs 3.8 no ubuntu 14.0.4  Os servidores Gluster estão se comunicando através de conexão direta infiniband e / 30 sub-rede; enquanto os clientes estão se conectando através da interface Ethernet 1G.

Agora, vezes que um dos servidores está fora por algum motivo, digamos uma reinicialização ou indisponibilidade de serviço, os clientes mantêm conexões, mas não conseguem ler ou gravar e, eventualmente, os clientes também. Se os servidores são réplica uns dos outros e se th

    
por h.safe 19.06.2018 / 18:25

1 resposta

0

Esclarecimento e possível explicação que poderia ser uma resposta à pergunta acima: uma. 2x replica de armazenamento pode ser de fato fornecer HA se seus arquivos como o meu é não-editável natureza ou seja, imagens ... então no caso de uma falha no nó de armazenamento principal glusterfs o secundário servirá e aceitará as gravações ... sobre o disponibilidade do principal servidor gluster ele faz a auto-cura e pode estar em serviço. b. No meu caso, havia um culpado subjacente sendo um grande número de arquivos de imagem gravados em uma pasta por um aplicativo, ou seja, 500.000 imagens em poucos dias sem realmente gerenciar a estrutura e a hiearchy ... isso acabaria levando a ineficiência dos servidores em sincronizar com cada outro e, eventualmente, quebrar a resposta do serviço. Ao corrigir o armazenamento de diretório e criar subdiretórios, nós o corrigimos.

    
por 25.06.2018 / 06:48