A primeira coisa que vem à mente é "arquivos esparsos". Tradicionalmente, é possível criar um arquivo com dados em um deslocamento no arquivo e, em seguida, procurar um deslocamento muito maior. Ao gravar dados no deslocamento muito maior, o sistema de arquivos não alocaria blocos de disco para os deslocamentos intermediários. Programas que lêem esses deslocamentos sem blocos de disco alocados lêem valores zero.
Capturar arquivos esparsos faz com que os deslocamentos de um arquivo esparso que não tenha blocos de disco alocados aloquem blocos de disco, tanto no arquivo tar (ou fluxo de saída) quanto no arquivo recriado.
Eu lembro que alguns DBMS criaram arquivos esparsos, assim como programas como o MSC / NASTRAN (sistema de modelagem de elementos finitos). Fazer o backup desses arquivos esparsos acaba usando grandes quantidades de armazenamento off-line, para surpresa de todos os envolvidos.