Problemas no NFS montado: 'Nenhum arquivo ou diretório', mas existem arquivos e diretórios

4

Portanto, estamos tendo um servidor de armazenamento NFS4 de tamanho médio executando o CentOS 6.6 exportando um compartilhamento NFS /storageDat (que é a raiz NFS, com dois volumes RAID vinculados: ./dat1 e ./dat2 ); Opções de exportação: rw,sync,no_wdelay,no_subtree_check,fsid=0

Temos o NFS montado em algumas estações de trabalho e desktops Fedora20 (> 100) e na maioria das vezes tudo funciona bem, usando grandes MTUs e opções de montagem do lado do cliente de rw,relatime,vers=4.0,rsize=8192,wsize=8192,namlen=255,soft,proto=tcp,port=0,timeo=600,retrans=2,sec=sys,clientaddr=10.216.10.1,local_lock=none,addr=10.216.14.200 , com o ponto de montagem /storageDat também bastante rápido (leia > transferências de 400MByte / s)

NO ENTANTO: De tempos em tempos, em máquinas únicas, o NFS fará o seguinte: um programa para executar tem que acessar uma determinada pasta profunda no NFS:

/storageDat/dat2/projects/other/Tool_does_special/ProjectX/Sample/tooloutputR2

O que resultará em um disco rígido "Nenhum arquivo ou diretório" Olhando no servidor, o diretório existe, os direitos de acesso estão corretos (até testados com o usuário em questão); de volta no cliente:

ls -al o arquivo completo lança o 'Nenhum arquivo ou diretório'

ls -al 'em um diretório pai a partir do caminho completo, isto é.

/storageDat/dat2/projects/other/Tool_does_special/

funciona e mostra os subdiretórios (ProjectX. ProjectY)

ls -al 'ing /storageDat/dat2/projects/other/Tool_does_special/ProjectX retorna a mensagem de erro de todos os presentes;

MAS indo para o diretório

cd /storageDat/dat2/projects/other/Tool_does_special/

e, em seguida, executar um ls -alR mostra todos os arquivos em todos os subdiretórios bem. Seguindo diretamente com um

ls -al em

/storageDat/dat2/projects/other/Tool_does_special/ProjectX/Sample/tooloutputR2

no entanto, falha com uma mensagem 'Não existe [...] arquivo'.

Achamos que ele está em algum lugar relacionado ao cache do NFS, mas simplesmente não pode identificar o erro, não pode prever sua aparência e não pode fazê-lo ir embora com segurança. Nem mesmo pensando em consertar isso.

Qualquer entrada seria muito apreciada! (E sim, renomei minhas pastas reais para algo que posso postar online)

    
por Mone 31.03.2015 / 12:23

1 resposta

1

O mesmo problema aconteceu comigo nos meus servidores. Eu tinha 12 servidores que montam uma pasta compartilhada de um servidor 13 que só tinha NFS e os outros 12 com o Autofs.

Bem, a coisa é que naquele 13º servidor eu descobri que o autofs estava rodando e com o mesmo arquivo de configuração que os outros 12 servidores, então basicamente ele estava tentando se montar no mesmo arquivo de origem / destino.

Parei o serviço Autofs nesse servidor e consegui acessar a pasta. Isso aconteceu quando você está trabalhando em várias máquinas ao mesmo tempo, em algum momento eu configurei o autofs no servidor quando não deveria.

chan!

    
por 01.08.2016 / 18:27