Are RAR-compressed files really less prone to corruption and thus easier to recover?
Até certo ponto, sim.
Quando você está tentando recuperar dados, é provável que você obtenha o início de um arquivo mais do que o final. Isso ocorre porque o sistema de arquivos sempre armazena um ponteiro para o início do arquivo na entrada de diretório. Depois disso, há algum tipo de cadeia (FAT, MFT, inodes, etc.) que controla cada parte subseqüente do arquivo. Se você tiver arquivos não desfragmentados (arquivos armazenados em um bloco de clusters contíguos), a recuperação de 100% do arquivo estará quase garantida, desde que você tenha o cluster inicial e o tamanho (você pode acabar com algum preenchimento de lixo no final). do arquivo, dependendo do programa de recuperação; o PhotoRec se enquadra nessa categoria). No entanto, se o arquivo estiver fragmentado (parte dele é armazenado aqui, parte dele, etc.), a recuperação não será provável e você terá apenas o primeiro cluster (512/4096 bytes) do arquivo.
A razão pela qual os arquivos RAR parecem estarem bem é porque eles armazenam a maior parte de seus meta-dados (por exemplo, os detalhes dos arquivos contidos) no início do arquivo. Como tal, quaisquer arquivos RAR que você encontrar que são, na verdade, arquivos RAR (ou seja, eles realmente começam como um arquivo RAR em vez de conter dados de outra coisa) parecerão funcionar. Por outro lado, os arquivos ZIP armazenam seus meta-dados no fim do arquivo, portanto, se você não tiver o arquivo inteiro, ele não poderá ser lido em todos os .
No entanto, se você estiver recuperando arquivos de um volume no qual um determinado arquivo pode ou não estar corrompido, as chances são igualmente boas (iguais a qualquer outro tipo de arquivo) de que o arquivo RAR também esteja corrompido e se você executar um arquivo-teste nele, informará que pelo menos alguns dos arquivos contidos estão corrompidos.
Should I store RAR-compressed files?
Como praticamente todo o resto do universo, tem seus prós e contras. Aqui estão alguns, mas eles não são realmente específicos para os RARs, eles se aplicam aos arquivos em geral:
- Prós
- Os dados reais são compactados, para que você possa recuperar mais dados por cluster
- Muitos formatos de arquivamento incluem a capacidade inata (quando selecionada) de se recuperar de um certo nível de corrupção, pois foram projetados para arquivamento em mídia não confiável
- Contras
- Dados binários são sempre mais difíceis de recuperar do que texto simples
- Como os arquivos são compactados, até mesmo uma pequena corrupção pode arruinar todo o arquivo, ao contrário de, por exemplo, um arquivo de texto simples ou gráfico que ainda pode ser usado se tiver um pouco de corrupção
Se você está se perguntando se deveria armazenar seus arquivos como RARs para aumentar o sucesso da recuperação, então eu diria que não. Se você está planejando para o futuro, então você está muito melhor usando técnicas mais tradicionais e comprovadas, como fazer backups. Se você usar RARs para arquivar dados importantes, adicione um registro de recuperação .