Estou executando um sistema Linux que monta muitas imagens de disco LVM e indexa o conteúdo do sistema de arquivos.
Freqüentemente (cerca de uma vez por dia), todo o sistema trava ao tentar montar uma imagem de disco LVM. O impasse dura por uma hora, durante o qual nenhum processo é capaz de progredir. Após uma hora, o temporizador do Watchdog de hardware reinicializa o sistema.
Eu vejo backtraces semelhantes ao abaixo frequentemente em /var/log/syslog
:
INFO: task kswapd0:134 blocked for more than 120 seconds.
Not tainted 3.13.0-48-generic #80-Ubuntu
"echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
kswapd0 D ffff88107fcd34c0 0 134 2 0x00000000
ffff881023f27bf0 0000000000000046 ffff881027e44800 ffff881023f27fd8
00000000000134c0 00000000000134c0 ffff881027e44800 ffff880240a9e600
ffff880240a9e604 ffff881027e44800 00000000ffffffff ffff880240a9e608
Call Trace:
[<ffffffff81725e39>] schedule_preempt_disabled+0x29/0x70
[<ffffffff81727ca5>] __mutex_lock_slowpath+0x135/0x1b0
[<ffffffff81727d3f>] mutex_lock+0x1f/0x2f
[<ffffffffa058b595>] dm_bufio_shrink_count+0x25/0x60 [dm_bufio]
[<ffffffff811610e8>] shrink_slab+0x108/0x370
[<ffffffff81164ce8>] balance_pgdat+0x3e8/0x610
[<ffffffff8116506b>] kswapd+0x15b/0x3f0
[<ffffffff810ab120>] ? prepare_to_wait_event+0x100/0x100
[<ffffffff81164f10>] ? balance_pgdat+0x610/0x610
[<ffffffff8108b5b2>] kthread+0xd2/0xf0
[<ffffffff8108b4e0>] ? kthread_create_on_node+0x1c0/0x1c0
[<ffffffff81731f0c>] ret_from_fork+0x7c/0xb0
[<ffffffff8108b4e0>] ? kthread_create_on_node+0x1c0/0x1c0
Já outras pessoas viram esse problema? Verifiquei os dm-devel
archives para problemas semelhantes a este, mas não encontrei problemas para mencionar um impasse.
Estou executando um kernel genérico do Ubuntu-3.13.0-91.