Chamadas F_WRLCK demoram muito tempo no NFS

2

Eu tenho o NFS compartilhado entre 30 nós de cluster. Os nós são o Debian 5 e 6. O servidor NFS é o OpenSolaris 2009. Temos um bom hardware e uma rede Infiniband de 20 Gbits.

Nos nós do cluster, as operações de fs são irritantes, mas não quando se trata de:

  • Mutt
  • Sqlite3
  • Um R lib. Por exemplo. %código%

Todos ficam presos por alguns minutos após as seguintes chamadas de sistema:

  • Rscript <(echo "library(GOstats)") ou
  • fcntl(3, F_SETLK, {type=F_WRLCK, whence=SEEK_SET, start=1073741824, len=1}

Qual poderia ser a causa? Como diagnosticar e corrigir?

Mudar o servidor NFS para OpenIndiana oi_148 corrigir?

    
por Aleksandr Levchuk 27.03.2011 / 03:31

3 respostas

0

Atualizado para o mais recente OpenIndiana. O problema desapareceu.

    
por 06.05.2011 / 04:17
1

Essas chamadas de sistema adquirem um bloqueio em um arquivo. Talvez outro processo tenha atualmente um bloqueio e seus processos travados aguardem a liberação desse bloqueio. Existem algumas dicas de solução de problemas (para uma versão mais antiga do Solaris, mas elas ainda podem ser úteis) no capítulo 11 de O'Reilly's Gerenciando NFS e NIS , 2a Edição.

    
por 27.03.2011 / 16:43
1

Veja se o serviço de bloqueio NFS está sendo executado no servidor.

    
por 27.03.2011 / 19:29