Isso é devido a um bloqueio mutex.
Verifique o rastreamento de pilha impresso com cuidado. Ele vai de cabeça para baixo. Você encontrará esta linha
mutex_lock_slowpath
Parece que há uma crise de recursos.
O Sysstat, como sugerido, é uma boa ferramenta de criação de perfil na maioria dos casos. Se você precisar ir para a raiz do problema, você precisará de um dump de memória do kernel ou vmcore. Existem dois arquivos / proc chamados
/proc/sys/kernel/hung_task_timeout_secs
/proc/sys/kernel/hung_task_panic
O valor do primeiro arquivo é 120. É por isso que você está vendo mensagens de que a tarefa está bloqueada por 120 segundos. Um teste trivial é aumentá-lo e ver o que acontece. Faça 240 ou 360.
O próximo arquivo por padrão tem um valor de 0. Isso precisa ser 1 se você quiser coletar um vmcore.
Obviamente, você precisa configurar o kdump e corrigir o destino do dump. O destino do dump deve ser maior que o tamanho da memória física. Mas mesmo se você coletar o vmcore, você precisará de algum conhecimento de C, assembly e depuração geral para obter um jeito. Um suporte profissional ou sysadmin pode ajudar melhor.
Mas, mudar de elevador não afetará nada aqui.