A resposta é testdisk / photorec, muitas vezes mais agarrar. Às vezes, o marcador inicial, o marcador final ou o tamanho do arquivo está corrompido, ou faz um palpite ruim e captura mais setores do que o necessário para um arquivo. Em seguida, outro arquivo tem um ponteiro nessa região e agarra setores sobrepostos novamente.
Portanto, agora o arquivo 1 contém todo o arquivo 1 mais dados aleatórios. Arquivo 2 contém parte dos dados aleatórios. Freqüentemente, esses programas não lidam bem com arquivos fragmentados, e isso também pode resultar em uma sobrecarga de dados.
Em um esforço para garantir que ele recupere o máximo possível, ele não rastreia os setores que fazem parte de outros arquivos, apenas no caso de errar. Portanto, os mesmos setores são duplicados em muitos arquivos.
Eu encontrei arquivos, como documentos do Word, eles dizem 2gb, mas quando abertos e salvos novamente com um novo nome, eles retornam ao tamanho correto.
Finja que cada símbolo é um cluster de armazenamento.
G é um arquivo GIF W é um documento do word U não é utilizado
GGGGGWWWWUUUG
A maioria dos arquivos tem um cabeçalho e um rodapé. Assim, quando as varreduras detectam o cabeçalho gif, ele procura o rodapé para o GIF. Portanto, agora o arquivo GIF recuperado contém GGGGGGGWWWWUUUG porque o arquivo está fragmentado. Em seguida, à medida que ele é executado, ele detecta o W ou o cabeçalho da palavra e o rodapé para que o documento da palavra saia corretamente como WWWW, apesar da captura anterior.