O compartilhamento NFS repentinamente não responde

1

Temos uma configuração envolvendo web e & separado servidores de e-mail montando vários compartilhamentos no mesmo servidor NFSv3 pysical.

O servidor da web usa um compartilhamento para arquivos vache do apache, o servidor de e-mail usa um compartilhamento para o correio do usuário. (Formato Maildir, courier-imap)

O servidor de e-mails, de repente e sem aviso, parece estar "travando" aleatoriamente devido à falta de resposta do compartilhamento nfs. 'df' trava quando chega ao compartilhamento nfs montado. Qualquer tentativa de acessar o compartilhamento de dentro do sistema trava efetivamente o processo.

O servidor web, até agora - permanece inalterado, então eu gostaria de pensar que podemos descartar problemas no servidor NFS. Web e & e-mail use as mesmas opções de montagem, das quais eu tentei várias combinações, sem sucesso. Às vezes, ele é executado sem problemas por semanas, mas acabamos bloqueando menos de 24 horas depois de aumentar a quantidade de threads do NFS no servidor & remontar as ações.

Quaisquer comentários ou sugestões?

saída de rpcinfo:

rpcinfo -p localhost

program vers proto   port
100000    2   tcp    111  portmapper
100000    2   udp    111  portmapper
100024    1   udp  32768  status
100024    1   tcp  60949  status
100021    1   udp  32769  nlockmgr
100021    3   udp  32769  nlockmgr
100021    4   udp  32769  nlockmgr
100021    1   tcp  41693  nlockmgr
100021    3   tcp  41693  nlockmgr
100021    4   tcp  41693  nlockmgr


rpcinfo -p $nfs_server

program vers proto   port
100000    2   tcp    111  portmapper
100000    2   udp    111  portmapper
100024    1   udp    752  status
100024    1   tcp    755  status
100011    1   udp    613  rquotad
100011    2   udp    613  rquotad
100011    1   tcp    616  rquotad
100011    2   tcp    616  rquotad
100003    2   udp   2049  nfs
100003    3   udp   2049  nfs
100003    4   udp   2049  nfs
100021    1   udp  37709  nlockmgr
100021    3   udp  37709  nlockmgr
100021    4   udp  37709  nlockmgr
100003    2   tcp   2049  nfs
100003    3   tcp   2049  nfs
100003    4   tcp   2049  nfs
100021    1   tcp  54549  nlockmgr
100021    3   tcp  54549  nlockmgr
100021    4   tcp  54549  nlockmgr
100005    1   udp    651  mountd
100005    1   tcp    654  mountd
100005    2   udp    651  mountd
100005    2   tcp    654  mountd
100005    3   udp    651  mountd
100005    3   tcp    654  mountd
    
por DNAspark99 26.04.2011 / 23:55

1 resposta

1

Na minha experiência. O NFS é notório por problemas como esse. Poderia estar relacionado a um problema com o seu switch de rede?

O servidor web e o servidor de e-mail acessam o mesmo servidor NFS? Caso contrário, tente mover o servidor NFS para seu email para uma porta de rede diferente e veja se isso ajuda.

Caso contrário, tente algumas destas opções no seu arquivo fstab. aumentar os tempos limite. Defina a opção suave. Você também pode querer experimentar a opção fsc (cache do sistema de arquivos). Espero que ele armazene em cache a operação de gravação e solucione seu problema.

Veja: link

Em uma nota lateral, seu servidor da Web está lendo principalmente. Seu servidor de e-mail está realizando principalmente gravações.

Se tudo isso falhar, eu consideraria abandonar o nfs e usar o iSCSI.

    
por 27.04.2011 / 00:17

Tags