Alta CPL resolvida temporariamente pelo reinício do NFS

1

CentOS 6.9

Eu tenho um servidor de arquivos NFS (v4) cujas exportações começaram a ficar muito lentas para responder aos clientes hoje. Enquanto isso está acontecendo, os volumes exportados não são lentos no próprio servidor.

acima mostra valores de CPL muito altos (> 100). Caso contrário, nada parece fora do comum.

Se eu reiniciar o nfs ( service nfs restart ), os valores de CPL começarão a cair rapidamente e os volumes se tornarão responsivos novamente nos clientes. No entanto, após 2 ou 3 minutos, os valores de CPL começam a subir novamente.

O dmesg não mostra nada além de algumas mensagens quando eu reinicio o nfs.

/ var / log / messages não mostra nada que pareça relevante

Alguém tem alguma ideia sobre o que pode estar acontecendo?

    
por Michael S 27.02.2018 / 23:07

1 resposta

1

   CPL  CPU load information.
        This  line contains the load average figures reflecting the number of threads that are available to run on a CPU (i.e. part of the runqueue) or that are wait‐
        ing for disk I/O. These figures are averaged over 1 ('avg1'), 5 ('avg5') and 15 ('avg15') minutes.
        Furthermore the number of context switches ('csw'), the number of serviced interrupts ('intr') and the number of available CPUs are shown.

Acho importante tirar isso do waiting for disk I/O . Eu estou apostando que um cliente está tentando fazer algo funky com os discos e isso está causando uma desaceleração para o resto dos clientes. Você verificou que tipo de largura de banda de rede está sendo usada? O link está totalmente saturado?

    
por 27.02.2018 / 23:29

Tags