Resposta curta: Seu NFS local não acredita que um arquivo ou diretório esteja lá. (sim, você meio que suspeitou disso)
O NFS é uma tecnologia antiga. Não foi feito para arquivos de alto acesso, que mudam rapidamente. Para sistemas dinâmicos de arquivos compartilhados, tente uma solução em cluster como OCFS2 (my fave) ou gluster (meh, Dark Side).
Vários anos atrás nós tínhamos 4 servidores montando um NFS comum e encontramos repetidamente que um servidor criaria um arquivo que os outros servidores não poderiam ver. Os 4 servidores eram servidores de aplicativos da web. Um usuário iniciaria uma ação para que um servidor criasse um pacote e atualizasse uma linha no banco de dados com o caminho NFS para o arquivo quando concluído. O navegador do usuário continuaria checando de volta a cada 10 segundos para ver se o trabalho estava pronto, e se era o download do arquivo. Você pode ver o problema chegando - o servidor atualizaria a linha no banco de dados que o arquivo estava lá, mas outro servidor obteria a solicitação do navegador do usuário - ele iria ler o arquivo e obter os erros "arquivo não encontrado".
Como você disse, no momento em que um administrador olhou para ele, o arquivo estava lá. Levamos semanas de vários de nós engenheiros cavando e cavando para encontrar o problema. Basicamente, executamos um loop de suspensão de 10 segundos que obteria o último caminho de arquivo criado, conforme indicado no banco de dados, e tentaria inserir o arquivo em um log. Consistentemente, o sistema que criou o arquivo pôde vê-lo, mas os outros não conseguiram por um determinado período de tempo. Esse intervalo de tempo foi maior à medida que a carga nos servidores aumentou.
Os chefes de cabelos pontudos não queriam mudar o NFS subjacente para um sistema de arquivos em cluster, então, em vez disso, nós também tínhamos o servidor de trabalho salvo que "ele" era o criador do arquivo no banco de dados. A solicitação do usuário continuaria tentando até que o trabalho fosse concluído e a solicitação chegasse ao servidor que criou o arquivo para que ele estivesse sempre lá para leitura. Sim, eu sei. Kludge. Mas isso é o que você obtém quando decide manter a tecnologia antiga - você tem que se mexer para fazer as coisas funcionarem. A tecnologia antiga é o primeiro kludge e tudo feito para trabalhar com ele é apenas mais kludge. Bem-vindo de volta aos anos 80 e ao FS Headroom da Max.
O NFS não mantém todos os clientes em sincronia com todas as alterações em tempo real. Assim, você constantemente se depara com condições em que um cliente cria um arquivo / diretório e outro não pode vê-lo, ou onde um cliente exclui um arquivo / diretório e outros clientes acham que ainda está lá (até tentar usá-lo - oops ).
Nós tentamos todos os tipos de truques para fazer com que os sistemas ressincronizassem o cache do cliente antes de tentar ler o arquivo. Não está acontecendo.
Minha recomendação: traga seu FS para este século. (experimente o capacitor de fluxo a 88 mph)