VmHWM apenas 25% considerando que deveria ser em torno de 80%

3

Eu tenho um servidor MySQL dedicado equipado com 128 GB de RAM. O MySQL é morto recentemente pelo oom-killer, embora o MySQL esteja configurado para usar 95 GB no pior dos casos. Na minha pesquisa me deparei com isso:

# cat /proc/11895/status
Name:   mysqld
State:  S (sleeping)
Tgid:   11895
Pid:    11895
PPid:   24530
TracerPid:      0
Uid:    27      27      27      27
Gid:    27      27      27      27
Utrace: 0
FDSize: 1024
Groups: 27
VmPeak: 72188044 kB
VmSize: 72122508 kB
VmLck:         0 kB
VmHWM:  33294036 kB
VmRSS:  32829668 kB
VmData: 72076496 kB
VmStk:        88 kB
VmExe:     11800 kB
VmLib:      3608 kB
VmPTE:     73388 kB
VmSwap:  4139376 kB
Threads:        59

Eu estou querendo saber, porque é o VmHWM e VmRSS em apenas cerca de 33 GB, enquanto em outro servidor (também um escravo para o mesmo mestre, configurado quase o mesmo (exceto para buffer pool), exceto, que tem 256 GB RAM), a saída é a seguinte:

# cat /proc/51298/status
Name:   mysqld
State:  S (sleeping)
Tgid:   51298
Pid:    51298
PPid:   50443
TracerPid:      0
Uid:    27      27      27      27
Gid:    27      27      27      27
Utrace: 0
FDSize: 2048
Groups: 27
VmPeak: 243701128 kB
VmSize: 239628932 kB
VmLck:         0 kB
VmHWM:  209331200 kB
VmRSS:  205515868 kB
VmData: 239582156 kB
VmStk:        88 kB
VmExe:     11800 kB
VmLib:      3608 kB
VmPTE:    409600 kB
VmSwap:        0 kB
Threads:        281

Aqui a memória é usada para cerca de 80%, enquanto que no servidor morto por oom é apenas cerca de 25% (observe que esses valores foram observados pouco antes de o oom-killer atacar novamente). Qual seria a razão? Não há processo concorrente. E o que posso fazer sobre isso?

    
por fancyPants 12.05.2017 / 15:11

1 resposta

0

Assim, um colega experimentou o suporte a páginas grandes e não reverteu todas as alterações efetuadas. Quando eu corri

sysctl -w vm.nr_hugepages=0

e comentou esta seção no /etc/sysctl.conf

# Hugepage Support MySQL
#vm.hugetlb_shm_group = 27
#kernel.shmmax = 10737418240
#kernel.shmall = 23689185
#vm.nr_hugepages = 46268

liberou 90 GB que foram desperdiçados. Isso pode ser visto na saída de cat /proc/meminfo :

HugePages_Total:   46268
HugePages_Free:    46268
HugePages_Rsvd:        0
HugePages_Surp:        0
Hugepagesize:       2048 kB

Muito obrigado a Matthew Ife. Por favor, vote sua resposta no serverfault.com ao invés desta.

    
por 15.05.2017 / 15:23