GlusterFS Mount Mantém-se Desconectando Aleatoriamente

3

Estamos usando o GlusterFS para fornecer um sistema de arquivos distribuídos em dois servidores da Web que usam um diretório de mídia compartilhada e um cache. Então eu criei 2 volumes gluster (media e var) e os montei em / var / www / site / media e / var / www / site / var /.

Cada servidor está executando o servidor gluster e o cliente para que tenhamos alguma redundância e consigamos manter os dados replicados. O volume var é escrito e lido muito strongmente.

O problema que estamos encontrando é que aleatoriamente as montagens irão quebrar e quando você executar um ls-la no diretório que está mostrando como d ??????? Para resolver o problema, tudo o que temos a fazer é desmontar o diretório e remontá-lo.

Eu revi os arquivos de log do glusterfs e posso ver quando o mount desapareceu

[2013-05-02 11:32:02.105021] I [client3_1-fops.c:502:client3_1_unlink_cbk] 0-site-media-client-1: remote operation failed: No such file or directory

[2013-05-02 11:32:02.105270] I [client3_1-fops.c:502:client3_1_unlink_cbk] 0-site-media-client-0: remote operation failed: No such file or directory


[2013-05-02 11:32:02.105299] W [fuse-bridge.c:911:fuse_unlink_cbk] 0-glusterfs-fuse: 11806336: UNLINK() /catalog/product/cache/1/image/1000x1000/9df78eab33525d08d6e5fb8d27136e95/v/e/some-stuff-0915740$


[2013-05-02 11:32:02.378497] I [client3_1-fops.c:502:client3_1_unlink_cbk] 0-site-media-client-0: remote operation failed: No such file or directory


[2013-05-02 11:32:02.378625] I [client3_1-fops.c:502:client3_1_unlink_cbk] 0-site-media-client-1: remote operation failed: No such file or directory

Gostaríamos de saber o que está causando esses problemas e resolvê-los para evitar essas interrupções no serviço.

Se você precisar de mais alguma informação, não hesite em perguntar e eu fornecerei o que puder.

As informações adicionais solicitadas estão abaixo, os dois servidores são idênticos:

Ubuntu 12.04.2

Linux VDED-XXX-XXX 3.2.0-39-genérico # 62-Ubuntu SMP Qui Fev 28 00:28:53 UTC 2013 x86_64 x86_64 x86_64 GNU / Linux

glusterfs 3.2.5 construído em 31 de janeiro de 2012 07:39:59

Servidores VMWare ESX

Erros dos registros de tijolos no momento da falha / desconexão / problema:

log de tijolos do site-media:

[2013-05-02 11:32:00.849296] I [server3_1-fops.c:964:server_unlink_cbk] 0-site-media-server: 9109306: UNLINK /catalog/product/cache/1/image/1000x1000/9df78eab33525d08d6e5fb8d27136e95/v/e/some-stuff-091574183930-box.jpg (0) ==> -1 (No such file or directory)

[2013-05-02 11:32:02.86607] I [server3_1-fops.c:964:server_unlink_cbk] 0-site-media-server: 9109345: UNLINK /catalog/product/cache/1/image/1000x1000/9df78eab33525d08d6e5fb8d27136e95/v/e/some-stuff-091574098692.jpg (0) ==> -1 (No such file or directory)

[2013-05-02 11:32:02.105131] I [server3_1-fops.c:964:server_unlink_cbk] 0-site-media-server: 12553441: UNLINK /catalog/product/cache/1/image/1000x1000/9df78eab33525d08d6e5fb8d27136e95/v/e/some-stuff-091574097992-box.jpg (0) ==> -1 (No such file or directory)

[2013-05-02 11:32:02.485694] W [inode.c:1044:inode_path] (-->/usr/lib/glusterfs/3.2.5/xlator/protocol/server.so(server_resolve+0xf8) [0x7f4534639418] (-->/usr/lib/glusterfs/3.2.5/xlator/protocol/server.so(server_resolve_inode+0x70) [0x7f4534639290] (-->/usr/lib/glusterfs/3.2.5/xlator/protocol/server.so(resolve_loc_touchup+0x105) [0x7f4534638425]))) 0-/var/gluster/wwrd-media/inode: no dentry for non-root inode 184269351: 11a65ece-7b4b-4364-a28c-63df686f5648

O log de blocos do site-var parece não conter erros

    
por Tim Lassie Freeborn 03.05.2013 / 16:59

1 resposta

2

Olhando para os logs. Definitivamente parece algum tipo de condição de corrida, pois há uma gravação intensa nessa pasta. Houve alguns bugs relatados para estes em 3.2. * Gluster Version. Eu sugiro que você atualize para o 3.3.1, que é totalmente suportado em seu sistema operacional. Muitos bugs e problemas de desempenho foram resolvidos. Você também pode fazer o upgrade da sua versão.

    
por 04.05.2013 / 16:23