Glusterd morto mas cluster ainda em execução

1

No momento, estamos executando um cluster de três nós no Gluster 3.6.4.

Em um de nossos nós, notamos que o daemon glusterd está morto.

Mas os daemons glusterfsd ainda estão em execução e acreditamos que os clientes estão se conectando e recuperando dados

Notamos que o daemon morreu há uma semana e não o vimos. As montagens distribuídas do NFS continuaram a funcionar normalmente

Gostaríamos de saber estamos seguros para ir em frente e começar o serviço novamente?

Se sim, isso acionaria uma auto-recuperação em todos os volumes? Como isso causaria um problema de desempenho.

Os registros deste nó são os seguintes:

[2016-08-19 18:01:52.804453] E [rpc-clnt.c:362:saved_frames_unwind] (--> /usr/lib64/libglusterfs.so.0(_gf_log_callingfn+0x1e0)[0x7f4f3ffca550] (--> /usr/lib64/libgfrpc.so.0(saved_frames_unwind+0x1e7)[0x7f4f3fd9f787] (--> /usr/lib64/libgfrpc.so.0(saved_frames_destroy+0xe)[0x7f4f3fd9f89e] (--> /usr/lib64/libgfrpc.so.0(rpc_clnt_connection_cleanup+0x91)[0x7f4f3fd9f951] (--> /usr/lib64/libgfrpc.so.0(rpc_clnt_notify+0x15f)[0x7f4f3fd9ff1f] ))))) 0-DAOS-client-4: forced unwinding frame type(GF-DUMP) op(DUMP(1)) called at 2016-08-19 18:01:51.886737 (xid=0x144a1d)
[2016-08-19 18:01:52.804480] W [client-handshake.c:1588:client_dump_version_cbk] 0-DAOS-client-4: received RPC status error
[2016-08-19 18:01:52.804504] W [socket.c:620:__socket_rwv] 0-glusterfs: readv on 127.0.0.1:24007 failed (No data available)
[2016-08-19 18:02:02.900863] E [socket.c:2276:socket_connect_finish] 0-glusterfs: connection to 127.0.0.1:24007 failed (Connection refused)

Se não formos seguros para fazer isso, o que mais devemos fazer para resolver isso

(informação útil: esta entrada do blog discute a diferença entre glusterfsd e glusterd link )

    
por Vorsprung 26.08.2016 / 11:35

1 resposta

1

Sim, seus volumes não podem ser recuperados sem um número necessário de nós votando no problema. E sim, ele deve reiniciar o processo de autocorreção quando você iniciar o glusterd.service. No entanto, ele só irá curar arquivos que foram marcados como precisando de cura.

Como você não notou a falta de daemon glusterd, estou assumindo que você não modifica muito os tijolos / volumes neste cluster. No entanto, os daemons glusterfsd estão todos em execução, o que significa que a autocura não deve ser necessária em grande parte.

A maior coisa a considerar é que a autocura é menos como uma leitura de patrulha e mais como uma limpeza seletiva - que só funciona em arquivos que foram marcados como sujos. Com isso em mente, iniciar o daemon glusterd não é uma grande preocupação.

    
por 26.08.2016 / 12:40