Desde esta tarde, algo está errado com o servidor. No lado do servidor, vejo mensagens em dmesg
da seguinte forma:
statd: server rpc.statd not responding, timed out
lockd: cannot unmonitor <client>
statd: server rpc.statd not responding, timed out
lockd: cannot monitor <client>
No lado do cliente, vejo em dmesg
:
lockd: server <server> not responding, still trying
lockd: server <server> OK
Isso está paralisando toda a rede! Eu tentei esta solução sugerido por Xian, mas não faz diferença.
Servidor, Debian Linux, Squeeze 64-bit:
>> uname -a
Linux <server> 2.6.32-5-amd64 #1 SMP Fri May 10 08:43:19 UTC 2013 x86_64 GNU/Linux
Clientes, Linux Mint 13-64bit:
>> uname -a
Linux <client> 3.2.0-49-generic #75-Ubuntu SMP Tue Jun 18 17:39:32 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux
Eu não executei uma atualização no servidor, então não sei o que poderia ter mudado. Eu atualizei uma de nossas máquinas clientes, mas não vejo por que isso iria mexer com o servidor, já que todas as máquinas parecem afetadas. Alguma idéia de como consertar isso?
UPDATE 1
O servidor parou por um tempo em
Starting portmap deamon
Starting NFS common utilities: statd idmapd
Isso leva cerca de 2 minutos até que a inicialização continue ...
UPDATE 2
É de fato a máquina cliente que foi atualizada que causou isso. Parece que de alguma forma parou statd
no servidor, fazendo com que todas as outras máquinas tenham problemas. Eu reiniciei toda a rede, deixando essa máquina desligada e não encontrei nenhum problema. Não é realmente uma correção, mas eu já fiz o downgrade dessa máquina novamente, e tudo parece estar estável.