Se você tiver sua opção de plataforma para seu servidor de arquivos, eu usaria uma versão recente do OpenSolaris e usaria o recurso de desduplicação do ZFS. Dessa forma, cópias de arquivos não ocupariam espaço adicional, e mesmo segmentos comuns entre arquivos não seriam replicados.
Você pode ler tudo sobre a desduplicação do ZFS em este post no Blog de Jeff Bonwick .