Eu mesmo vi algo parecido, embora tenha sido há alguns anos atrás.
No meu caso, era memória de problemas e, ao copiar dados, havia alguma forma de armazenamento em cache que eu suspeitava estar usando lentamente a memória até chegar à memória do problema e ... boom! computador caiu. Um teste de memória deve identificar isso com bastante facilidade, ou talvez remover alguma memória para ver se resolve ou piora o problema?
Se não, então duvido que a taxa de transferência de dados esteja relacionada e que a taxa de transferência esteja simplesmente atrasando o problema enquanto oculta a causa real.
pode valer a pena verificar os tempos de CPU apenas no caso de a cópia de dados estar a causar trabalho de CPU suficiente para aumentar o ponto de falha? ou seja, com um ventilador com falha ou dissipador de calor deslizado? desacelerar a cópia de dados está apenas reduzindo a carga o suficiente para atrasar o aumento da temperatura.
Por último, você não diz como seus discos estão configurados? ou seja, RAID ou JBOD? você consegue mover as unidades para outro servidor individualmente ou como um grupo? obviamente, não os mova apenas se forem drives RAID, exceto como último, último recurso! a menos que você saiba o que está fazendo, é claro!
HTH