Eu tenho um cliente Linux montando um compartilhamento NFS do servidor linux usando autofs
. Isso funciona bem até o servidor cair. O ponto de montagem autofs
se encarrega de recusar a reagir a ls
e quaisquer outros comandos.
Aparentemente, esse é um problema conhecido (leitura de superusuário e outras fontes), então finalmente criei uma configuração que funciona bem :
timeo=2,soft,bg,retrans=1,retry=0
Aparentemente, não é ideal, pois ainda causa problemas.
O que me intriga é o fato de que o tempo limite do cliente aumenta com o tempo. Eu vou este script muito básico para testes:
while true ; do
date ; time -f "Seconds %e" ls -l /mnt/diag_ccsrv65/crapfile >/dev/null
sleep 10
done
Espero que autofs
desconecte o caminho /mnt/diag_ccsrv65
e o torne indisponível para os clientes. Por outro lado, soft
enviaria tempos limite para os clientes. O que acontece é isto:
Mon Apr 16 16:52:10 CEST 2018
Seconds 0.03
Mon Apr 16 16:52:20 CEST 2018
Seconds 0.03
Mon Apr 16 16:52:30 CEST 2018
Seconds 0.03
Aqui eu mataria o servidor.
Mon Apr 16 16:52:40 CEST 2018
ls: cannot access /mnt/diag_ccsrv65/crapfile: Input/output error
Seconds 4.02
Mon Apr 16 16:52:54 CEST 2018
ls: cannot access /mnt/diag_ccsrv65/crapfile: Input/output error
Seconds 6.02
Mon Apr 16 16:53:10 CEST 2018
ls: cannot access /mnt/diag_ccsrv65/crapfile: Input/output error
Seconds 6.00
Eu poderia viver com 6 segundos, mas aumenta bastante rapidamente:
Mon Apr 16 16:53:26 CEST 2018
ls: cannot access /mnt/diag_ccsrv65/crapfile: Input/output error
Seconds 12.00
Mon Apr 16 16:53:48 CEST 2018
ls: cannot access /mnt/diag_ccsrv65/crapfile: Input/output error
Seconds 72.57
Mon Apr 16 16:55:10 CEST 2018
ls: cannot access /mnt/diag_ccsrv65/crapfile: Input/output error
Seconds 284.04
Não encontrei nenhuma informação sobre esse comportamento de tempo limite. Certamente não é culpa de autofs
, porque o mesmo acontece com um mount
comum.
Qualquer ponteiro / dica apreciada.