Bloqueios NFS intermitentes no cluster Isilon

5

Temos um cluster Isilon com 8 nós IQ 12000x que exporta armazenamento por meio de vários compartilhamentos NFS para vários clientes Linux e Solaris.

Existe um sistema Linux que possui um desses sistemas de arquivos NFS montados. AE / S para este sistema de arquivos é moderadamente pesada do sistema Linux. A cada 3-4 semanas (não está em qualquer tipo de horário discernível, e às vezes é mais / menos frequente do que isso), notamos que toda a atividade cessa nessa montagem NFS (o processo trava, como se a rede parasse de funcionar, então o processo é preso em sono ininterrupto) - 30 minutos depois, o compartilhamento se recupera e as coisas continuam funcionando normalmente. O log do kernel da máquina afetada é o seguinte:

Dec  3 10:07:29 redacted kernel: [8710020.871993] nfs: server nfs-redacted not responding, still trying
Dec  3 10:37:17 redacted kernel: [8711805.966130] nfs: server nfs-redacted OK

linha /etc/fstab relevante:

nfs-redacted:/ifs/nfs/export_data/shared/...redacted... /data nfs defaults 0 0

Eu verifiquei se há algum processo agendado, por exemplo tarefas agendadas, funções relacionadas com o Isilon, por exemplo instantâneos, etc, que podem estar causando esses bloqueios, mas não consigo encontrar nada. Eu também não estou ciente de qualquer problema relacionado à rede ou manutenção que poderia causar isso. Todos os bloqueios duram quase exatamente 30 minutos nos registros do kernel.

Talvez alguém tenha algumas sugestões que eu possa tentar? (Eu considerei uma montagem flexível para evitar os problemas associados aos processos que acessam o sistema de arquivos suspensos; no entanto, sou cauteloso quanto à corrupção que poderia resultar e, de fato, isso não resolveria o problema subjacente).

    
por blackbox222 03.12.2012 / 17:32

1 resposta

0

Verifique se os valores da sua MTU estão corretos até a topologia da fiação. Se o seu cliente de camada de acesso estiver configurado para 9000 e estiver passando por um comutador. Certifique-se de que o switch possa lidar com tamanhos maiores de MTU.

    
por 06.08.2015 / 00:56