Eu tenho um sistema baseado no Ubuntu 14.04 LTS I5 que hospeda três VMs e tem funcionado feliz por cerca de um ano. Recentemente, configurei uma unidade USB para fazer backup das unidades da VM e escrevi um script simples para desligar as VMs, copiar as unidades para o backup e reiniciar a VM toda segunda-feira às 3 da manhã. Simples eh?
Bem, não é bem assim. Aproximadamente metade do tempo, o trabalho falha com uma das operações cp no script terminalmente suspenso no estado "D" (ps -ax / suspensão ininterrupta) que pode ser rastreada até um pânico do kernel (mostrado via dmesg) em que a tarefa cp "foi bloqueado por 120 segundos."
Anteriormente, eu havia pesquisado esse erro e descoberto configurações que tinham reivindicado a solução desse problema, conforme foi observado aqui que direcionou a adição dessas duas linhas para /etc/sysctl.conf:
vm.dirty_background_ratio = 5
vm.dirty_ratio = 10
Eu fiz isso, reiniciei e os backups foram executados com êxito duas semanas seguidas. Eu pensei que o problema foi resolvido, mas voltou a ocorrer na noite passada.
Os arquivos que estão sendo armazenados em backup são de mais de 50 GB, indo para uma unidade de backup de 2 TB. Eu tive zero outros problemas com esta caixa desde que eu criei um ano atrás - somente desde que essa unidade de backup foi introduzida, esse problema se manifestou. Então estou inferindo que a unidade de backup deve pelo menos ser considerada como parte do problema.
A única maneira de resolver esse problema é reiniciar o sistema com dificuldade, o que nunca é uma opção desejável. Alguém tem alguma ideia sobre esse problema? É um problema de kernel do Linux, ou eu poderia estar lidando com uma unidade de backup USB temperamental?
Quaisquer outras sugestões bem-vindas e apreciadas.