Como consertar w_await muito alto no desktop linux?

1

Meu desktop do Linux (Debian sid) começou a ficar lento nas últimas semanas. Quando investiguei, descobri que:

  1. Não há escassez de RAM - o sistema usa regularmente apenas metade de seu 4G, há mais de 1G livre, mesmo quando contando caches e buffers;
  2. A lentidão está associada ao acesso a arquivos; por exemplo, abrir uma pasta no KMail induz um mini-congelamento;
  3. Quando fica lento, a CPU está gastando muito tempo no iowait.

Quando eu procurei mais, encontrei coisas assim:

$ iostat -x -d /dev/sda
Device:         rrqm/s   wrqm/s     r/s     w/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await r_await w_await  svctm  %util
sda               0.05     7.90    3.14    2.41    23.27    40.94    23.11    12.02 2163.14   57.59 4906.16  31.58  17.55

Se eu entendi corretamente, o valor de w_await (quase 5000) é muito alto, o valor de await (média de r_await e w_await?) é muito alto como resultado e, caso contrário, as coisas são normais.

Quando olho para o iotop em momentos de lentidão excessiva, geralmente vejo todos os zeros, com picos de 99,9% de iowait para o kjournald, flush e às vezes os processos que espero (por exemplo, KMail).

O sistema tem sido usado como uma "distribuição contínua" por vários anos, todos os sistemas de arquivos são ext3.

Ah, e claro: Enquanto swap é definido (neste disco, que é o único montado constantemente no sistema), quase nunca é usado (como eu disse, o 4G está longe de estar exausto).

Os únicos erros que eu vi no dmesg são os gritos de processos que foram bloqueados (no pico de problemas - nos primeiros minutos após a reinicialização) por mais de 120 segundos. Principalmente syslog. Parece não haver nenhuma outra indicação de falha de disco (o smartctl diz que tudo sempre esteve bem, exceto no tempo há muito tempo quando o fluxo de ar do disco esquentou).

Estou usando o linux 3.2; Eu tentei reverter todo o caminho de volta para 2.6.38, sem sucesso.

É o disco? Os sistemas de arquivos ficaram loucos? O que mais posso verificar?

    
por Shai Berger 12.03.2012 / 00:21

2 respostas

1

No seu caso, você diz que uma substituição de disco rígido a consertou. Isso é bom. No entanto, na minha experiência, embora recentemente eu vi apenas em laptops, este é mais frequentemente um problema de hardware sata no nível da placa-mãe, e no caso de laptops, eu nunca fui capaz de repará-lo. Mudar o drive não teve efeito, e como eu só vi sintomas similares em laptops, posso apenas sugerir que você tente mudar o drive e, se isso não funcionar, provavelmente é a placa-mãe.

Incidentalmente, eu reinstalei os sistemas operacionais várias vezes e pensei que tinha trabalhado em torno das falhas (que acontecem tanto no Windows e em todas as versões Linux que eu tinha usado), mas eles pareciam voltar, após alguns períodos de uso pesado, levando-me a acho que havia um componente térmico no hardware / chipset-glitch.

(Isto tudo está assumindo que você não apenas trocou os kernels e que, portanto, há alguns problemas nos drivers do kernel, mas conforme você tentou vários níveis de kernel, isso corresponde claramente aos meus problemas recentes.)

    
por 13.03.2012 / 03:50
0

Por que vale a pena, para quem acha isso, quero resumir.

Linha de fundo: Foi, parece ter sido, de fato, o disco. Eu substituí-lo e as coisas parecem voltar ao normal.

No caminho, encontrei duas verificações interessantes (e baratas):

1) Para ter certeza de que o problema não estava na minha própria configuração do sistema operacional, tentei gerar alguma atividade de disco de um live CD. Como suspeito, a E / S foi horrível.

2) Para ter certeza de que o problema não foi apenas com um sistema de arquivos, usei algum espaço livre no disco e tentei criar um novo sistema de arquivos. Isso foi terrivelmente lento e, além disso, após o término, o sistema operacional não conseguia nem ler o executável "travar" do disco.

O terceiro teste foi, na verdade, o mais caro que Warren sugeriu - substituindo o disco. O novo disco parece estar ok.

    
por 15.03.2012 / 08:19