Único processo bloqueia a montagem do NFS no nó inteiro

1

Temos uma montagem NFS e um cluster PBS no qual todos os nós montam esse ponto de montagem do NFS.

Estamos vendo que um único processo em um dos nós de cluster do PBS pode saturar completamente e atrapalhar a montagem do NFS nesse nó. Esse é um problema enorme, pois o PBS geralmente agendará vários trabalhos no mesmo nó, os trabalhos somente especificarão restrições de CPU e memória, mas o PBS não parece estar preocupado com as restrições de E / S. Isso significa que um único trabalho de IO encadernado que pode não exigir muita CPU e memória pode tornar o nó inteiro inutilizável, pelo menos no que diz respeito à montagem do NFS.

Eu posso reproduzir esse problema simplesmente executando o seguinte comando em um nó:

cat /nfsmount/verylargefile.txt > /dev/null

Isso essencialmente impedirá que qualquer outro processo nesse nó acesse a montagem do NFS. Até mesmo fazer um simples "ls / nfsmount" levará uma eternidade. Observe que o desempenho do mesmo ponto de montagem do NFS não é afetado em outros nós, portanto, isso parece ser um problema do lado do cliente.

Alguém tem alguma experiência com esse tipo de comportamento? Há alguma armadilha que eu deveria estar procurando? Eu teria pensado que deveria haver alguma lógica que tentaria distribuir a "largura de banda" de uma montagem NFS se houvesse vários processos acessando-a para evitar que esse tipo de recurso passasse por um único processo.

Nosso cluster PBS está executando o RedHat 6.5, mas também o reproduzi na minha estação de trabalho Ubuntu 14.04.

    
por StFS 25.04.2014 / 12:31

0 respostas

Tags