Média alta de carga na espera de E / S

2

Meu servidor está com picos médios de carga muito altos (> 10, às vezes até > 20) a cada alguns minutos.

top mostra que a CPU não está em uso, mas está aguardando operações de E / S:

top - 17:42:28 up 8 days,  8:10,  1 user,  load average: 9.01, 10.16, 6.54
Cpu0  :  0.0%us,  0.0%sy,  0.0%ni,  0.0%id,100.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu1  :  0.0%us,  0.0%sy,  0.0%ni,  0.0%id,100.0%wa,  0.0%hi,  0.0%si,  0.0%st

O dmesg mostra essa saída várias vezes (não entendo o que isso significa):

ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x2
ata2.00: BMDMA stat 0x26
ata2.00: cmd ca/00:08:74:c4:24/00:00:00:00:00/ef tag 0 dma 4096 out
         res 51/84:01:7b:c4:24/84:00:10:00:00/ef Emask 0x30 (host bus error)
ata2.00: status: { DRDY ERR }
ata2.00: error: { ICRC ABRT }
ata2: soft resetting link
ata2.00: configured for UDMA/33
ata2: EH complete
sd 3:0:0:0: [sdb] 625142448 512-byte hardware sectors (320073 MB)
sd 3:0:0:0: [sdb] Write Protect is off
sd 3:0:0:0: [sdb] Mode Sense: 00 3a 00 00
sd 3:0:0:0: [sdb] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA

Alguma idéia?

Há FreeRADIUS em execução no servidor e suspeito que o adaptador de rede RADIUS esteja causando o problema. Durante alguns picos o tcpdump mostrou um aumento no número de pacotes RADIUS sendo enviados / recebidos (mas estou falando de dezenas de pacotes por minuto, não milhares deles).

Quando eu paro a situação do RADIUS fica melhor, mas ainda há picos médios de carga periódica (mais tolerável).

Alguém tem uma ideia do que pode estar causando esse comportamento e como posso determinar com certeza se é o RADIUS, o adaptador de rede ou alguma outra coisa?

Obrigado

    
por celicni 09.12.2011 / 18:44

2 respostas

3

Não, isso é um disco ou um controlador de disco está morrendo. Isso não tem nada a ver com o software que você está executando ou com o adaptador de rede.

Se você ainda não estiver fazendo backups, crie um NOW e comece a procurar por hardware substituto.

    
por 09.12.2011 / 18:51
0

Uma pergunta quase idêntica como esta foi postada na SU

Antes de reinicializar ou mexer nas configurações - faça backup (e paridade verifique isso!) o mais rápido possível.

    
por 09.12.2011 / 18:57