Estamos usando o GlusterFS para fornecer um sistema de arquivos distribuídos em dois servidores da Web que usam um diretório de mídia compartilhada e um cache. Então eu criei 2 volumes gluster (media e var) e os montei em / var / www / site / media e / var / www / site / var /.
Cada servidor está executando o servidor gluster e o cliente para que tenhamos alguma redundância e consigamos manter os dados replicados. O volume var é escrito e lido muito strongmente.
O problema que estamos encontrando é que aleatoriamente as montagens irão quebrar e quando você executar um ls-la no diretório que está mostrando como d ??????? Para resolver o problema, tudo o que temos a fazer é desmontar o diretório e remontá-lo.
Eu revi os arquivos de log do glusterfs e posso ver quando o mount desapareceu
[2013-05-02 11:32:02.105021] I [client3_1-fops.c:502:client3_1_unlink_cbk] 0-site-media-client-1: remote operation failed: No such file or directory
[2013-05-02 11:32:02.105270] I [client3_1-fops.c:502:client3_1_unlink_cbk] 0-site-media-client-0: remote operation failed: No such file or directory
[2013-05-02 11:32:02.105299] W [fuse-bridge.c:911:fuse_unlink_cbk] 0-glusterfs-fuse: 11806336: UNLINK() /catalog/product/cache/1/image/1000x1000/9df78eab33525d08d6e5fb8d27136e95/v/e/some-stuff-0915740$
[2013-05-02 11:32:02.378497] I [client3_1-fops.c:502:client3_1_unlink_cbk] 0-site-media-client-0: remote operation failed: No such file or directory
[2013-05-02 11:32:02.378625] I [client3_1-fops.c:502:client3_1_unlink_cbk] 0-site-media-client-1: remote operation failed: No such file or directory
Gostaríamos de saber o que está causando esses problemas e resolvê-los para evitar essas interrupções no serviço.
Se você precisar de mais alguma informação, não hesite em perguntar e eu fornecerei o que puder.
As informações adicionais solicitadas estão abaixo, os dois servidores são idênticos:
Ubuntu 12.04.2
Linux VDED-XXX-XXX 3.2.0-39-genérico # 62-Ubuntu SMP Qui Fev 28 00:28:53 UTC 2013 x86_64 x86_64 x86_64 GNU / Linux
glusterfs 3.2.5 construído em 31 de janeiro de 2012 07:39:59
Servidores VMWare ESX
Erros dos registros de tijolos no momento da falha / desconexão / problema:
log de tijolos do site-media:
[2013-05-02 11:32:00.849296] I [server3_1-fops.c:964:server_unlink_cbk] 0-site-media-server: 9109306: UNLINK /catalog/product/cache/1/image/1000x1000/9df78eab33525d08d6e5fb8d27136e95/v/e/some-stuff-091574183930-box.jpg (0) ==> -1 (No such file or directory)
[2013-05-02 11:32:02.86607] I [server3_1-fops.c:964:server_unlink_cbk] 0-site-media-server: 9109345: UNLINK /catalog/product/cache/1/image/1000x1000/9df78eab33525d08d6e5fb8d27136e95/v/e/some-stuff-091574098692.jpg (0) ==> -1 (No such file or directory)
[2013-05-02 11:32:02.105131] I [server3_1-fops.c:964:server_unlink_cbk] 0-site-media-server: 12553441: UNLINK /catalog/product/cache/1/image/1000x1000/9df78eab33525d08d6e5fb8d27136e95/v/e/some-stuff-091574097992-box.jpg (0) ==> -1 (No such file or directory)
[2013-05-02 11:32:02.485694] W [inode.c:1044:inode_path] (-->/usr/lib/glusterfs/3.2.5/xlator/protocol/server.so(server_resolve+0xf8) [0x7f4534639418] (-->/usr/lib/glusterfs/3.2.5/xlator/protocol/server.so(server_resolve_inode+0x70) [0x7f4534639290] (-->/usr/lib/glusterfs/3.2.5/xlator/protocol/server.so(resolve_loc_touchup+0x105) [0x7f4534638425]))) 0-/var/gluster/wwrd-media/inode: no dentry for non-root inode 184269351: 11a65ece-7b4b-4364-a28c-63df686f5648
O log de blocos do site-var parece não conter erros