Ubuntu 10.10 O Maverick Server faz o sistema travar em intervalos aleatórios (i7 930; 12GB RAM)

2

Para introduzir: Eu tenho uma máquina com as seguintes especificações:

  • Intel Core i7 930
  • 12 GB Ram Corsair
  • 2xSamsung HDD 320gb (Sem Raid, apenas partições)
  • Asus P6TD Deluxe

A máquina está no Datacenter há apenas alguns dias. A carga média é de 0,50 e eu tenho as seguintes partições:

 /        ext4    noatime,barrier=0,errors=remount-ro 0 1
 /datos   ext4    noatime                             0 2

Agora o problema: Em intervalos aleatórios, a máquina trava, o SSH fica muito lento e, ao visualizar o htop, diz que todos os núcleos estão sendo martelados pelos processos do sistema. link

Saída de Iostat durante o congelamento (comprei quando finalmente consegui executar um comando durante o congelamento):

iostat
Linux 2.6.35-22-server (charizard)         25/10/10        _x86_64_        (8 CPU)

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           4,33    0,00   10,38    1,21    0,00   84,07

Device:            tps   Blk_read/s   Blk_wrtn/s   Blk_read   Blk_wrtn
sda               2,68       269,23         0,01     906918         24
sdb              52,30       897,99      1896,08    3024878    6386976

Saída do Vmstat:

vmstat 1
procs -----------memory---------- ---swap-- -----io---- -system-- ----cpu----
 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa
 0  1      0 5680460 128056 1907340    0    0   115   131 1091 2621  4  9 86  1
 4  0      0 5676360 128064 1909036    0    0  1872    52 4606 18143 10 33 57  0

Eu suspeito que o ext4 está relacionado com esses congelamentos, mas eu não tenho certeza de qualquer maneira. Ubuntu foi instalado há uma semana, antes de enviar a máquina para datacenter, antes disso, eu tinha o windows 7 para testar o desempenho e não tinha nenhum tipo de congelamento

Por favor, se você conhece outro comando para rastrear a origem deste congelamento, me avise, Estou pensando em formatá-lo novamente para debian lenny, que era o S.O que eu costumava instalar em outra máquina sem problemas

Obrigado.

EDIT 1: eu remontei "/ datos" com barreira = 0, agora estou monitorando se os problemas aumentarem novamente.

EDIT 2: Remontar / dados com barreira = 0 não funcionou u.u. Ainda tentando encontrar a solução

    
por Rodrigo 26.10.2010 / 03:43

3 respostas

0

Acabei de relatar um bug ao Launchpad sobre o mesmo problema, cinco dias atrás. É também um Intel Core i7-930, em uma placa-mãe Intel DX58SO:

link

Certamente o seu é o mesmo problema, sua descrição combina muito com o meu problema. Verifique se a interrupção do temporizador do seu sistema congela durante esses bloqueios. Mantenha isso em execução em um terminal:

watch -d grep timer /proc/interrupts

Você precisará de uma fonte externa de interrupções durante o bloqueio para fazer com que o agendador de processos opere e veja o comando sendo executado. Pingar seu computador de outra máquina (com um pequeno intervalo) ajudará.

Se a interrupção do temporizador parar de incrementar durante o bloqueio, o problema será o mesmo. Por favor, adicione suas informações de sistema ao relatório de erros acima para que possamos chamar a atenção dos desenvolvedores do Ubuntu:

ubuntu-bug -u 665796 -p linux
    
por 29.10.2010 / 22:49
0

Exceto pelo martelar dos processadores, eu teria imaginado que era relacionado ao DNS.

A razão pela qual eu diria que o DNS é

  1. A máquina foi movida para um novo datacenter
  2. Congelamentos aleatórios geralmente vêm de algo que tenta se conectar e os tempos limite

Você verificou o resolv.conf e confirmou que os servidores dns estão acessíveis?

    
por 27.10.2010 / 21:50
0

Já experimentou o mesmo problema com o 10.10, também um Core-i7 930, mas com uma memória RAM de 6 GB. Na pesquisa, pode ser um problema com regressões no Xorg - você está usando algum tipo de ambiente de desktop GUI? Se sim, este relatório de bug pode ser relevante para você: link

    
por 29.10.2010 / 22:34