Instância do Amazon EC2 - m1.medium Ubuntu 12.04 - Começou a falhar há três dias

1

O ambiente:

Amazon EC2 Instance - m1.medium
Ubuntu 12.04
Apache 2.2.22 - Running a Drupal Site
Using MySQL DB Server

RAM info:

~$ free -gt
         total       used       free     shared    buffers     cached
Mem:             3          1          2          0          0          0
-/+ buffers/cache:          0          2
Swap:            0          0          0
Total:           3          1          2

Hard drive info:

Filesystem      Size  Used Avail Use% Mounted on
/dev/xvda1      7.9G  4.7G  2.9G  62% /
udev            1.9G  8.0K  1.9G   1% /dev
tmpfs           751M  180K  750M   1% /run
none            5.0M     0  5.0M   0% /run/lock
none            1.9G     0  1.9G   0% /run/shm
/dev/xvdb       394G  199M  374G   1% /mnt

O problema

Cerca de dois dias atrás, o site começou a falhar porque o servidor MySQL foi encerrado pelo Apache com a seguinte mensagem:

kernel: [2963685.664359] [31716]   106 31716   226946    22748   0
        0             0 mysqld
kernel: [2963685.664730] Out of memory: Kill process 31716 (mysqld) 
        score 23 or sacrifice child
kernel: [2963685.664764] Killed process 31716 (mysqld) 
        total-vm:907784kB, anon-rss:90992kB, file-rss:0kB
kernel: [2963686.153608] init: mysql main process (31716)
        killed by KILL signal
kernel: [2963686.169294] init: mysql main process ended, respawning

Isso indica que a VM estava ocupando 0,9 GB, mas meu Ram tem 2 GB grátis, então 1 GB ainda estava livre. Eu entendo que no Linux as aplicações podem alocar mais memória do que fisicamente disponível. Eu não sei se este é o problema, é a primeira vez que isso começou a acontecer. Obviamente, o servidor MySQL tenta reiniciar, mas aparentemente não há memória para ele e ele não será reiniciado. Aqui está o seu log de erros:

Plugin 'FEDERATED' is disabled.
The InnoDB memory heap is disabled
Mutexes and rw_locks use GCC atomic builtins
Compressed tables use zlib 1.2.3.4
Initializing buffer pool, size = 128.0M
InnoDB: mmap(137363456 bytes) failed; errno 12
Completed initialization of buffer pool
Fatal error: cannot allocate memory for the buffer pool
Plugin 'InnoDB' init function returned error.
Plugin 'InnoDB' registration as a STORAGE ENGINE failed.
Unknown/unsupported storage engine: InnoDB
[ERROR] Aborting

[Note] /usr/sbin/mysqld: Shutdown complete

Eu simplesmente reiniciei o serviço Mysql. Cerca de duas horas depois, aconteceu novamente. Eu reiniciei. Então aconteceu novamente 9 horas depois. Então pensei no parâmetro MaxClients do apache.conf, então fui verificar. Foi fixado em 150. Decidi deixar cair para 60. Como assim:

<IfModule mpm_prefork_module>
    ...
    MaxClients            60
</IfModule>

<IfModule mpm_worker_module>
    ...
    MaxClients            60
</IfModule>

<IfModule mpm_event_module>
    ...
    MaxClients           60
</IfModule>

Uma vez que fiz isso, reiniciei o serviço apache2 e tudo correu bem para 3/4 de um dia. Já que à noite o serviço MySQL desligava mais uma vez, mas desta vez não foi morto pelo serviço Apache2. Em vez disso, chamou o OOM-Killer com a seguinte mensagem:

kernel: [3104680.005312] mysqld invoked oom-killer: gfp_mask=0x201da, order=0, 
                         oom_adj=0, oom_score_adj=0
kernel: [3104680.005351]  [<ffffffff81119795>] oom_kill_process+0x85/0xb0
kernel: [3104680.548860] init: mysql main process (30821) killed by KILL signal

Agora estou sem ideias. Alguns artigos afirmam que o ideal é mudar o comportamento do kernel com o seguinte (incluí-lo no arquivo /etc/sysctl.conf)

vm.overcommit_memory = 2
vm.overcommit_ratio = 80

Portanto, não haverá supercompromissos. Eu estou querendo saber se este é o caminho a percorrer? Tenha em mente que eu não sou administrador do servidor, tenho conhecimento básico.

Obrigado um monte de antecedência.

    
por Chayemor 06.06.2014 / 13:00

0 respostas