Isso não é realmente digno de ser chamado de resposta, mas ... no caso de alguém ter o mesmo problema.
Eu não posso explicar, mas o problema foi resolvido mudando para um host KVM diferente em um hardware diferente, mas não acho que foi um problema real de hardware.
Temos dois servidores.
Um Cisco que possui 2 procs quad core. Linux mostra 16 processadores. Eu acho que é com hyperthreading.
Um HP DL360 com 2 proces dual core. Linux mostra 8 processadores.
Ambos executam o Ubuntu 14.04 LTS com as últimas atualizações.
O problema foi com a VM do Windows 2012 em execução no Cisco. Funcionaria absolutamente bem depois de uma reinicialização, mas depois iria lentamente ao longo do dia seguinte, até ficar praticamente inutilizável. Eu normalmente aloquei 2 VCPUs para a VM. O problema seria menos grave se eu alocasse apenas 1 VCPU, mas ainda assim seria muito ruim. Nada mais parecia ajudar. Não encontrei nada em nenhum registro do convidado ou do host.
Por fim, em um palpite, malabarizei nossas VMs (estou com pouco espaço em disco) e movi o Windows 2012 para a HP. Tem funcionado perfeitamente por uma semana. A razão pela qual eu não acho que a Cisco esteja com defeito é que as quatro VMs Linux que tínhamos na HP agora estão funcionando perfeitamente na Cisco.
Eu só fiz outra alteração além de mover hosts para, por conveniência, mover a unidade do Windows C: de um LVM do Linux para um arquivo qcow2. Eu acho que poderia ter sido isso em vez do movimento. O desempenho do disco não é um problema para nós.