Pode ser devido a milhares de motivos. Este parâmetro hung_task foi introduzido desde o RHEL 5.5.
Você não deve desativá-lo, você perderia importantes opções de rastreio e depuração de pilha. Aqui, isso mostra que houve algum problema com o write-back da página no sistema de arquivos ext3 e a página que estava sendo escrita estava bloqueada. A tarefa responsável por escrever a página foi pdflush e entrou no estado D, o que significa esperar que o IO seja concluído. Até que o IO esteja completo, ele não pode ser interrompido, como no estado D. Quando o pdflush está entrando no estado D, o congelamento do servidor é bastante natural, pois é o encadeamento do kernel responsável por gravar páginas sujas no disco.
Então, possíveis pistas. Você está escrevendo muitos dados sujos, verifique sua condição de memória. Encontre /proc/meminfo
para saber disso.
Se você não está escrevendo muitos dados sujos, pode haver outros problemas. O rastreamento de pilha não indica muito além disso. Você tem outros traços.
Se você tiver suporte ao servidor, poderá fazer isso echo 1 > /proc/sys/kernel/hung_task_panic
. Isso criará um vmcore na próxima vez que o tempo limite da tarefa suspensa for atingido. Você precisa definir o kdump para isso. Siga os artigos da Red Hat ou qualquer blog linux respeitável para fazer isso. De vmcore, a razão exata pode ser encontrada. Fora isso, é só ver o traço e adivinhar as coisas.