How do companies manage large file servers (e.g. 17 TB) and their related backups on a very tight-budget?
Depende das restrições de desempenho e orçamento. Por exemplo, o Backblaze (uma empresa de backup na nuvem) tem um orçamento muito restrito para cada TB, mas eles não precisam do melhor desempenho ou do tempo de resposta para os dados. Algumas outras empresas podem precisar de desempenho barato, mas encontram uma maneira de reduzir os dados necessários (com a deduplicação, a remoção de dados antigos de backup ou simplesmente reduzindo os dados reais que podem não ser necessários para os negócios).
Is it ok to use ZFS (or BTRFS) on a single virtual disk for its copy-on-write nature to eliminate the need for fsck? (i.e. not for its RAID, snapshot, etc. features)
Eu não usaria o BTRFS em nada que não fosse de desenvolvimento, no qual você precisa confiar na segurança de seus dados como primeiro princípio. Eu usaria o ZFS porque não encontrei uma alternativa mais barata e segura a ele (outros FS com recursos semelhantes da IBM, NetApp etc. são mais caros, outros sistemas de arquivos livres não são maduros (HAMMER2, BTRFS) ou carecem de recursos essenciais ( ext2 / 3/4, reiserfs, etc.).
Suas respostas específicas: Eu preferiria o plano 3, mas o plano 2 também funcionaria.
Ao contrário de muito FUD flutuando na web, o ZFS não se importa com o armazenamento subjacente, seja ele físico, virtual ou misto. É claro que só pode ser tão bom / rápido / seguro quanto o armazenamento subjacente e só pode raciocinar sobre o que é dado. Isso significa que seu desempenho não será tão bom quanto o nativo, sua solução de problemas envolve as duas camadas e ambas as camadas podem ter problemas. Se você souber disso e aprovar essas desvantagens, vejo isso como uma alternativa viável.
Você ainda tem recursos de conforto como enviar / receber, snapshots, CoW, somas de verificação e desduplicação em nível de bloco. O que você sacrifica é principalmente desempenho e possivelmente segurança (se sua SAN é apenas um único disco, por exemplo). Você também deve ajustar os tamanhos do setor do ZFS ( ashift
) para o armazenamento subjacente ao criar o pool. Você pode ter tamanhos diferentes para sistemas de arquivos individuais depois, mas a configuração do conjunto não pode ser revertida sem destruí-lo.
Mas primeiramente eu avaliaria se a reescrita desses scripts e integrações é tão demorada quanto você imagina. Além disso, até mesmo aparelhos como FreeNAS (ou napp-it, para nomear uma alternativa) têm geralmente scripts de usuário ou plugins ou módulos definidos pelo usuário, que sobrevivem às atualizações e funcionam bem com o appliance (o novo FreeNAS 10 aka Corral substituiu seu plugin arquitetura com Docker, se isso é algo que você está familiarizado com ele pode ser uma alternativa).