Deixe-me começar com uma pequena pergunta sobre a qual elaborarei abaixo: Qual configuração você usaria para um servidor de arquivos doméstico que provavelmente não perderia dados, mas manteria o custo baixo o máximo possível?
No momento, estou procurando atualizar o servidor inicial (os detalhes da configuração atual estão abaixo). Eu estou procurando algo que principalmente pode atuar como um NAS, mas se não for muito mais caro, seria bom se ele também pudesse hospedar um servidor Plex, um servidor VPN e talvez algumas outras pequenas coisas. Ele irá armazenar documentos, fotos, músicas e vídeos, no total, aproximadamente 3Tb. Minha principal preocupação é a integração de dados e, em segundo lugar, a velocidade e a disponibilidade. Por exemplo. Eu não me importaria de uma semana de inatividade quando uma unidade falha.
Parece que é recomendado ter três cópias de todos os dados de quais estão fora do site. No meu caso, a segunda cópia seria em um servidor na casa dos meus pais, sincronizada via internet. A terceira cópia que eu criaria em um disco rígido externo local que só é conectado durante o backup.
O problema agora é: como garanto que os dados são consistentes em todas as unidades e que nenhum arquivo foi alterado? Localmente, isso pode ser feito usando o ZFS e seu checksum, mas isso requer várias unidades em um único local, aumentando drasticamente o custo da configuração.
Outro problema é como lidar com o controle de versão dos dados. Por exemplo, em caso de emergência, gostaríamos de poder acessar os dados do último mês. Além disso, esses pontos parecem muito bem cobertos pelo ZFS, mas novamente parecem ser apenas uma opção viável com mais unidades.
Atualmente estou usando dois Raspberry Pi 2's como um servidor de arquivos, cada um com um disco rígido externo conectado. Ambos estão em locais diferentes, hospedam seus próprios arquivos e fazem backup para o outro através da Internet usando o rsync. O controle de versão é feito usando links físicos. No momento em que coloquei isso em conjunto, percebi que, no caso de um dos servidores cair, eu poderia simplesmente tirar o outro off-line, comprar um novo Pi e HDD e copiar a unidade boa para o novo servidor. No entanto, as duas unidades são formatadas com o ext3 e recentemente entendi que erros nos dados armazenados podem não ser notados imediatamente. Isso me alarmou, já que o objetivo é manter os dados seguros. Daí esta questão.
Além disso, na época eu não levava em conta que, durante a recuperação, o único disco bom seria muito estressado, o que provavelmente faria com que eu perdesse todos os meus dados. Usando esse raciocínio, continuo adicionando unidades redundantes em todos os lugares, obviamente aumentando muito o preço. Isso me traz de volta à pergunta original: em que ponto você tem redundância suficiente em uma solução de armazenamento doméstico?
Tags backup nas filesystems