So what happens if I upload a file/archive, then later, the file changes locally, and the next time I do a backup, how does Glacier deal with this since it can't overwrite the file with a new version?
De acordo com as Perguntas frequentes sobre geleiras :
You store data in Amazon Glacier as an archive. Each archive is assigned a unique archive ID that can later be used to retrieve the data. An archive can represent a single file or you may choose to combine several files to be uploaded as a single archive. You upload archives into vaults. Vaults are collections of archives that you use to organize your data.
Então, o que isso significa é que cada arquivo enviado por você recebe um ID exclusivo. Carregue o mesmo arquivo duas vezes e cada cópia do arquivo receberá seu próprio ID. Isso lhe dá a capacidade de restaurar as versões anteriores do arquivo, se desejar.
Use the locally stored archive inventory to determine what data doesn't exist anymore and if it's > 3 months old, delete it from Glacier? That seems straightforward but is there a better approach to this?
Para evitar a sobretaxa pela exclusão de dados com menos de três meses, essa é provavelmente a melhor abordagem. Mas não serão apenas os dados que não existem mais que você precisa rastrear & excluir. Como mencionado acima, sempre que um arquivo for alterado e você fizer o upload novamente para o Glacier, você receberá um novo ID para o arquivo. Você também desejará excluir as versões mais antigas do arquivo, supondo que não queira restaurar as versões mais antigas.
If a 20 MB zip file is uploaded that contains 10,000 files, and one of those files is changed locally, do I need to upload another 20 MB zip file? Now I'm required to eat the cost of storing 2 copies of almost everything in those zip files... Also, how would I deal with deleting things in a ZIP file that don't exist locally anymore? Since I don't want to delete the whole zip file, now I'm incurring fees to store files that don't exist anymore.
Essa é a troca que você realmente precisa decidir por si mesmo. Você tar / zip tudo e, em seguida, ser forçado a rastrear esses arquivos e tudo o que há neles, ou vale a pena fazer upload de arquivos individualmente para que você possa limpá-los individualmente, já que eles não são mais necessários.
Algumas outras abordagens que você pode considerar:
- Possuem dois ou mais arquivos tar / zip, um que contenha arquivos que provavelmente não serão alterados (como arquivos de sistema) e outros que contenham arquivos de configuração e outras coisas com maior probabilidade de mudar com o tempo.
- Não se preocupe em rastrear arquivos individuais e fazer backup de tudo em um único arquivo tar / zip que seja enviado para o Glacier. À medida que cada arquivo chega ao ponto de 3 meses (ou possivelmente até mais tarde), basta apagá-lo. Isso dá a você uma maneira muito fácil de rastrear & restaurar a partir de um determinado ponto no tempo.