Como encontrar o que está usando o linux swap ou o que está no swap?

12

Eu tenho servidor Linux virtual (Fedora 17) com 28 GB de RAM e 2 GB de swap. O servidor está executando um banco de dados MySQL que está configurado para usar a maior parte da memória RAM.

Depois de algum tempo em execução, o servidor começa a usar o swap para trocar páginas não utilizadas. Isso é bom como o meu swappiness está no padrão 60 e é o comportamento esperado.

O estranho é que o número em top / meminfo não corresponde a informações de processos. Ou seja o servidor está relatando esses números:

/proc/meminfo:
SwapCached:        24588 kB
SwapTotal:       2097148 kB
SwapFree:         865912 kB

top:
Mem:  28189800k total, 27583776k used,   606024k free,   163452k buffers
Swap:  2097148k total,  1231512k used,   865636k free,  6554356k cached

Se eu usar o script do link , ele relatará números razoáveis (alguns MBs trocados por bash'es, systemd etc. ) e uma grande alocação do MySQL (eu omiti muitas linhas de saída):

892        [2442] qmgr -l -t fifo -u
896        [2412] /usr/libexec/postfix/master
904        [28382] mysql -u root
976        [27559] -bash
984        [27637] -bash
992        [27931] SCREEN
1000       [27932] /bin/bash
1192       [27558] sshd: admin@pts/0
1196       [27556] sshd: admin [priv]
1244       [1] /usr/lib/systemd/systemd
9444       [26626] /usr/bin/perl /bin/innotop
413852     [31039] /usr/libexec/mysqld --basedir=/usr --datadir=/data/mysql --plugin-dir=/usr/lib64/mysql/plugin --log-error=/data/mysql/err --open-files-limit=8192 --pid-file=/data/mysql/pid --socket=/data/mysql/mysql.sock --port=3306
449264   Total Swap Used

Portanto, se eu obtiver a saída do script corretamente, o uso total da troca deve ser 449264K = ca. 440MB com mysql usando ca. 90% do swap.

A questão é por que isso difere tanto dos números top e meminfo? Existe alguma maneira de "dump" informações de swap para ver o que está realmente em vez de somar os usos de swap de todos os processos?

Ao analisar o problema, descobri diferentes ideias, mas todas parecem estar erradas:

  1. A saída do script não está em KB. Mesmo que seja em unidades de 512 ou 4KB, não será compatível. Na verdade, a proporção (1200: 440) é de cerca de 3: 1, o que é um número "estranho".
  2. Existem algumas páginas no swap que são de alguma forma compartilhadas entre os processos, conforme mencionado no link . Se isso é verdade, como posso encontrar o número real de memória usada assim? Quero dizer que precisaria fazer a diferença de 800MB cca. E isso não parece certo neste cenário.
  3. Existem algumas páginas "antigas" na troca usadas pelos processos que já terminaram. Eu não me importaria se conseguisse descobrir quanto é esse swap "livre".
  4. Existem páginas na swap que foram trocadas de volta para a memória e estão em swap apenas no caso de elas não mudarem na RAM e precisarem ser trocadas novamente como mencionado em link . Mas o valor de SwapCached é de apenas 24 MB.

O mais estranho é que o uso da troca está aumentando lentamente, enquanto a saída da soma do script é aproximadamente a mesma. Nos últimos 3 dias a troca usada aumentou de 1100MB para os atuais 1230MB enquanto a soma aumentou de 430MB para os atuais 449MB (ca.).

O servidor tem RAM livre suficiente para que eu possa desligar o swap e ligá-lo novamente. Ou eu provavelmente poderia configurar o swappiness para 0, então o swap seria usado apenas se não houvesse outra maneira. Mas eu gostaria de resolver o problema ou, pelo menos, descobrir qual é a causa disso.

    
por Radek Hladík 05.11.2013 / 14:17

2 respostas

8

O Fedora 18 e superior tem smem nos repos. Você pode baixar o script python e instalar a partir da fonte .

Aqui está um exemplo de saída (algo recortado e anonimizado) da minha máquina:

# smem -s swap -t -k -n
  PID User     Command                         Swap      USS      PSS      RSS 
20917 1001     bash                               0     1.1M     1.1M     1.9M 
28329 0        python /bin/smem -s swap -t        0     6.3M     6.5M     7.4M 
 2719 1001     gnome-pty-helper               16.0K    72.0K    73.0K   516.0K 
  619 0        @sbin/mdadm --monitor --sca    28.0K    72.0K    73.0K   248.0K 

[big snip]

32079 42       gnome-shell --mode=gdm         41.9M     1.9M     2.0M     5.0M 
32403 1001     /opt/google/chrome/chrome -    43.1M   118.5M   119.4M   132.3M 
 4844 1002     /opt/google/chrome/chrome      48.1M    38.1M    41.9M    51.9M 
 5411 1002     /opt/google/chrome/chrome -    54.6M    33.4M    33.5M    36.8M 
 5624 1002     /opt/google/chrome/chrome -    72.4M    54.9M    55.5M    65.7M 
24328 1002     /opt/Adobe/Reader9/Reader/i    77.5M     1.9M     2.0M     5.2M 
 4921 1002     /opt/google/chrome/chrome -   147.2M   258.4M   259.4M   272.0M 
-------------------------------------------------------------------------------
  214 14                                       1.1G     1.1G     1.2G     1.7G 

A fonte também fornece smemcap que armazenará todos os dados relevantes para que o smem possa ser executado posteriormente.

   To  capture  memory statistics on resource-constrained systems, the the
   smem source includes a utility named  smemcap.   smemcap  captures  all
   /proc entries required by smem and outputs them as an uncompressed .tar
   file to STDOUT.  smem can analyze the output using the --source option.
   smemcap is small and does not require Python.
    
por 06.11.2013 / 14:51
4

Você deve verificar este script em outra máquina, porque meu sistema mostra o uso correto da troca:

# Your_script.sh
111280   Total Swap Used
# free
Swap:     33551716     120368   33431348

Muito perto de 111280 ~ = 120368.

Além disso, veja este script:

for proc in /proc/*; do cat $proc/smaps 2>/dev/null | awk '/Swap/{swap+=$2}END{print swap "\t'readlink $proc/exe'"}'; done | sort -n | awk '{total+=$1}/[0-9]/;END{print total "\tTotal"}'

Deste segmento:

link

    
por 05.11.2013 / 17:25