Em teoria, tal técnica reduziria muito os custos de largura de banda, mas também aumentaria os custos de CPU. Eu sugiro que você dê uma olhada no Rsync e veja como esta ferramenta resolveu este problema sem o uso de diretórios hash. Também dados padrões de dados específicos, é possível ter colisões de hash onde dois arquivos teriam exatamente o mesmo hash MD5. Isso só se torna um problema se a versão nova e antiga de um arquivo específico tiver o mesmo hash MD5. É raro, mas acontece.