Você pode querer analisar uma solução de SAN. Eu trabalhei com um cliente que tinha grandes necessidades de dados. Eles estavam adicionando TB's de novos dados fornecidos pelo usuário todos os meses. Devido ao orçamento, optamos por discos SATA baratos em RAID 5 e abarrotamos o máximo que pudemos em um servidor 2U. Isso funcionou por um tempo, mas à medida que eles continuavam crescendo, problemas de desempenho, escalabilidade e gerenciamento surgiram.
Soluções como EqualLogic, NetApp e outras fornecem alta escalabilidade e boas ferramentas de gerenciamento - elas têm etiquetas de preço para corresponder.
Você não especificou a largura de banda que espera usar, mas pesquisar soluções baseadas em nuvem que também fornecem serviços de entrega pode ser outra opção, especialmente se você estiver procurando uma solução de pagamento à medida que for indo.
Temos acesso ao CDN da Internap através de um de nossos parceiros. Podemos armazenar dados em seus sistemas e depois entregá-los via CDN. Eu nunca perguntei sobre 40 TB de armazenamento, mas não acho que isso seja um problema.
Se você construir 4 sistemas de 10TB, precisará esclarecer estas questões: 1) Quantos nós de servidores front-end irão se conectar a eles? 2) Com que frequência os arquivos serão acessados? 3) Como você planeja fazer backup dos dados? 4) Qual método de conexão você usará NFS, GFS, iSCSI? 5) Como os requisitos de tráfego / armazenamento serão alterados ao longo do tempo?
Todas essas considerações são muito importantes para escolher uma tecnologia. Embora a construção de 4 sistemas de 10 TB possa ser fácil e relativamente barata, se eles não conseguirem lidar com as cargas de serviço em 3 a 5 meses, seu dinheiro terá sido desperdiçado.
Dica: Muitas vezes, com sites de compartilhamento de mídia (se é isso o que é isso), alguns arquivos são mais populares do que outros. 10-20% do seu conteúdo total pode representar > 80% do seu tráfego total. Nesse caso, você pode considerar sistemas de armazenamento "rápidos" e "lentos". Mantenha as coisas populares no sistema rápido e arquive o sistema mais lento.