Estamos vendo instâncias de uma VM com os seguintes sintomas:
- carga média 800, processos emperrados, CPU 100% em iowait
- a leitura de arquivos funciona, a gravação de arquivos suspende o sistema
- A utilização de RAM é alta, mas isso é esperado quando o sistema está funcionando corretamente
- / var / log / messages não mostra nada suspeito: nenhuma falha no kernel, nenhum OOM kill, mas temos alguns stacktrace do kernel como Tarefas bloqueadas por mais de 120s com um stacktrace relacionado ao armazenamento.
- o hipervisor mostra a VM quase inativa em termos de utilização da CPU.
A reinicialização do sistema é a única maneira de fazê-lo funcionar novamente.
- rastreamento de pilha no dmesg mencionando tarefas do kernel interrompidas por mais de 120 segundos em syscalls io_write / sync
O hipervisor é o Oracle Enterprise Linux 7.2, a VM é o CentOS 6.6. Está executando um dispositivo jboss. O dispositivo de bloco é do tipo virtio. A unidade qcow é hospedada localmente no hypervisor, em um SSD. Suspeitamos que algo está errado no sistema de arquivos - > dispositivo de bloqueio - > camada virtio.