Atualizado para o mais recente OpenIndiana. O problema desapareceu.
Eu tenho o NFS compartilhado entre 30 nós de cluster. Os nós são o Debian 5 e 6. O servidor NFS é o OpenSolaris 2009. Temos um bom hardware e uma rede Infiniband de 20 Gbits.
Nos nós do cluster, as operações de fs são irritantes, mas não quando se trata de:
Todos ficam presos por alguns minutos após as seguintes chamadas de sistema:
Rscript <(echo "library(GOstats)")
ou fcntl(3, F_SETLK, {type=F_WRLCK, whence=SEEK_SET, start=1073741824, len=1}
Qual poderia ser a causa? Como diagnosticar e corrigir?
Mudar o servidor NFS para OpenIndiana oi_148 corrigir?
Essas chamadas de sistema adquirem um bloqueio em um arquivo. Talvez outro processo tenha atualmente um bloqueio e seus processos travados aguardem a liberação desse bloqueio. Existem algumas dicas de solução de problemas (para uma versão mais antiga do Solaris, mas elas ainda podem ser úteis) no capítulo 11 de O'Reilly's Gerenciando NFS e NIS , 2a Edição.
Veja se o serviço de bloqueio NFS está sendo executado no servidor.
Tags nfs opensolaris openindiana