já viu isso acontecer com muitas pessoas.
na maioria das vezes, o problema é um desses:
O tráfego de backupnão está perfeitamente isolado do tráfego de gerenciamento de cluster. como a Ethernet é uma merda, o aumento nas colisões de pacotes reduz drasticamente a largura de banda e o tempo de ida e volta para a pulsação. e depois boom! O CSV está inativo
outro problema comum é que a velocidade geral da Ethernet é muito baixa em comparação com a carga geral. quando o backup é iniciado, você recebe um grande aumento no tráfego por todos os tipos de motivos.
até onde sei, não há como prolongar o tempo limite. O CSV é extremamente exigente com o tempo limite do heartbeat. Depois de encontrar esse problema em alguns sites, definimos o limite de velocidade de E / S no BackupChain para reduzir o risco de isso ocorrer. No entanto, a solução real é evitar essas lacunas de conexão, pelo que vi até agora ...