O NFS continua a falhar aleatoriamente, a quebra é montada em outros clientes

5

Eu interconecto vários dos meus servidores Linux com o NFS. Por um tempo, está indo bem, mas, por algum motivo, fica cada vez mais instável

Exemplo: Copie um arquivo de 4 GB do cliente para o servidor NFS, falha antes de terminar com um erro de E / S. dmesg está preenchido com

[1525450.884071] nfs: server quackron not responding, timed out
[1525451.384072] nfs: server quackron not responding, timed out
[1525451.884072] nfs: server quackron not responding, timed out
[1525452.384086] nfs: server quackron not responding, timed out
[1525452.884065] nfs: server quackron not responding, timed out
[1525584.112127] nfs: server quackron not responding, timed out
[1525669.492066] nfs: server quackron not responding, timed out
[1525930.544062] nfs: server quackron not responding, timed out

Opções de montagem (as várias opções extras são para evitar que um servidor NFS que está desaparecendo bloqueie todo o diretório até que ocorra uma reinicialização ou uma desmontagem)

rw,intr,soft,timeo=5,retrans=5,actimeo=10,retry=5,vers=4,addr=10.0.0.20,clientaddr=10.0.0.1

Indo para o servidor, eu recebo isso no dmesg

[1384141.237197] NFSD: Using /var/lib/nfs/v4recovery as the NFSv4 state recovery directory
[1384141.237237] NFSD: starting 90-second grace period
[1439491.137710] nfsd: last server has exited, flushing export cache
[1439492.461197] NFSD: Using /var/lib/nfs/v4recovery as the NFSv4 state recovery directory
[1439492.461236] NFSD: starting 90-second grace period

Não consigo encontrá-lo neste dmesg ou no log, mas sei que vi erros "nfsd last server has sinalize 15". Pesquisando não parece encontrar nenhuma informação útil

Alguma idéia é o que faria com que o nfs falhasse constantemente?

Nota: Este servidor está executando o Ubuntu Server 11.10 e está totalmente atualizado

    
por TheLQ 23.02.2012 / 21:00

2 respostas

3

Como teste, modifique sua montagem no lado do cliente para:

sudo mount -t nfs -o intr,hard,timeo=14,rsize=8192,wsize=8192 

ou, se você colocar em fstab no lado do cliente:

remoteserver:/remote/path /local/path nfs rsize=8192,wsize=8192,hard,timeo=14,intr 0 0 

Eu uso essas configurações no trabalho e nós rotineiramente transferimos várias TB por semana.

Use essas configurações adicionando nenhuma das outras, exceto as variáveis de caminho específicas.

    
por 26.03.2012 / 03:57
0

Se for uma VLAN NFS dedicada, verifique se você não tem nenhum IP duplicado em sua rede. Eu apenas depurei um problema muito parecido com isso, e descobriu-se que havia alguns erros de digitação nos arquivos do kickstart e de 40 hosts, nós tínhamos 5 que usavam endereços IP duplicados. O NFS funcionaria muito bem e as cópias seriam rápidas por um tempo, mas o desempenho diminuiria gradativamente, depois seria interrompido por completo.

    
por 26.03.2012 / 21:49

Tags