Qualquer sistema de arquivos distribuído sofrerá quando executar operações em lote em um grande número de arquivos: afinal de contas, ele teve que propagar todas as alterações para uma máquina remota e o foguete de latência comparado ao host local apenas. Isso pode ser especialmente perceptível ao executar operações de alteração de metadados: não tocar em dados reais, eles são muito rápidos localmente; no entanto, a replicação remota será totalmente ligada à latência.
Você tem basicamente duas soluções:
- use uma abordagem de compartilhamento de arquivos, carregando seus arquivos em uma caixa específica e exportando-os via NFS. Enquanto o NFS não é uma bala de prata (e não é um monstro de velocidade), quando acoplado com o cache do lado do cliente, ele pode executar adequadamente
- use um sistema de replicação de arquivos assíncrono como
lsyncd
(ou algo baseado emrsync
)