Temos um cluster Isilon com 8 nós IQ 12000x que exporta armazenamento por meio de vários compartilhamentos NFS para vários clientes Linux e Solaris.
Existe um sistema Linux que possui um desses sistemas de arquivos NFS montados. AE / S para este sistema de arquivos é moderadamente pesada do sistema Linux. A cada 3-4 semanas (não está em qualquer tipo de horário discernível, e às vezes é mais / menos frequente do que isso), notamos que toda a atividade cessa nessa montagem NFS (o processo trava, como se a rede parasse de funcionar, então o processo é preso em sono ininterrupto) - 30 minutos depois, o compartilhamento se recupera e as coisas continuam funcionando normalmente. O log do kernel da máquina afetada é o seguinte:
Dec 3 10:07:29 redacted kernel: [8710020.871993] nfs: server nfs-redacted not responding, still trying
Dec 3 10:37:17 redacted kernel: [8711805.966130] nfs: server nfs-redacted OK
linha /etc/fstab
relevante:
nfs-redacted:/ifs/nfs/export_data/shared/...redacted... /data nfs defaults 0 0
Eu verifiquei se há algum processo agendado, por exemplo tarefas agendadas, funções relacionadas com o Isilon, por exemplo instantâneos, etc, que podem estar causando esses bloqueios, mas não consigo encontrar nada. Eu também não estou ciente de qualquer problema relacionado à rede ou manutenção que poderia causar isso. Todos os bloqueios duram quase exatamente 30 minutos nos registros do kernel.
Talvez alguém tenha algumas sugestões que eu possa tentar? (Eu considerei uma montagem flexível para evitar os problemas associados aos processos que acessam o sistema de arquivos suspensos; no entanto, sou cauteloso quanto à corrupção que poderia resultar e, de fato, isso não resolveria o problema subjacente).