nfs e cifs compartilhados pendurados no Linux

3

Eu tenho um NAS (Dlink DNS-323) que eu montei na minha caixa linux. Ele costumava funcionar bem, e então eu atualizei minha distro (apt-get upgrade). Estou executando o Linux Mint Debian Edition. O kernel atual é:

oliver@astro ~ $ uname -a
Linux astro 3.11-2-amd64 #1 SMP Debian 3.11.8-1 (2013-11-13) x86_64 GNU/Linux

Eu costumava montá-lo como um compartilhamento cifs usando o autofs, mas depois da atualização ele se tornou problemático. Especificamente, eu poderia montar o compartilhamento, mas se eu lesse e / ou escrevesse rapidamente ele iria travar e retornar uma variedade de erros. Por exemplo, abrir uma pasta com várias fotos no gThumb e depois clicar rapidamente no botão "próximo" geralmente é o suficiente para que ele seja interrompido. Uma vez suspenso, nenhum programa (incluindo ls, lsof, fuser, ferramentas gráficas de sistema de arquivos, etc.) pode acessar o compartilhamento - todos eles ficam suspensos. No entanto, ler e / ou escrever para o compartilhamento "lentamente" é bom.

Eu tentei uma grande variedade de correções, incluindo:

  • Muitas opções de montagem diferentes. Muitos para lembrar de todos, mas alguns destaques incluem nounix, sec = ntlm, sec = ntlmv2, etc.
  • Montando como um compartilhamento nfs em vez de um compartilhamento cifs
  • Montagem via / etc / fstab em vez de autofs. Tentei isso tanto para cifs e nfs

Todos têm o mesmo comportamento. O problema não é o próprio NAS, pois continua a funcionar bem em outros computadores da casa. O problema também não é a placa de rede nesta máquina como eu posso navegar na web, assistir vídeos, etc, tudo bem. Isso parece ser específico da minha máquina Mint. Aqui está a linha no meu / etc / fstab atual que estou usando para montar o compartilhamento via cifs:

//192.168.0.3/Volume_1  /media/dlink    cifs    guest,rw,uid=oliver,gid=oliver,nounix,sec=ntlm  0   0

E aqui está a linha correspondente do / etc / mtab:

//192.168.0.3/Volume_1 /media/dlink cifs rw,relatime,vers=1.0,sec=ntlm,cache=strict,uid=1000,forceuid,gid=1000,forcegid,addr=192.168.0.3,file_mode=0755,dir_mode=0755,nounix,serverino,rsize=61440,wsize=65536,actimeo=1 0 0

O erro mais comum que vejo em / var / log / syslog é:

Feb 19 17:01:47 localhost kernel: [  276.258055] CIFS VFS: Server 192.168.0.3 has not responded in 120 seconds. Reconnecting...

Isso é de longe o mais comum, e geralmente é tudo que vejo. Em alguns pontos, vi outras mensagens de erro, embora eu tenha medo de não conseguir reproduzi-las no momento.

Uma outra pista. Parece que depois que eu recebo erros com a unidade eu costumo ver o seguinte aparecer em / var / log / syslog:

Feb 19 17:04:57 localhost minissdpd[4451]: 12 new devices added
Feb 19 17:05:01 localhost minissdpd[4451]: 1 new devices added

Eu sei que o minissdpd é uma coisa UPnP e não tem nada a ver com isso. Pode ser um arenque vermelho, mas eu o vejo com tanta frequência depois que tenho problemas e geralmente não vejo isso de outra forma, então pensei em mencioná-lo.

Alguma ideia?

    
por Oliver Dain 20.02.2014 / 02:09

1 resposta

2

Depois de muita depuração e de descrições de pacotes, localizei isso em um problema no driver da placa de rede. O buffer da placa de rede estava transbordando, então a pilha do TCP continuava achando que os pacotes haviam sumido. A troca de placas de rede resolveu o problema.

    
por 03.03.2014 / 03:04