Por um lado, essa reportagem parece confusa. Isso acontece devido à diferença no tamanho do bloco (512, 1k, 4k, etc.) definido para o sistema de arquivos concreto, mas também devido ao número de arquivos descritos em metadados (sistema de arquivos geralmente o mantém no mesmo dispositivo aumentando assim o disco uso).
Por outro lado, é muito útil descobrir qual é o tamanho dos dados úteis (reais) e como é diferente do uso do espaço em disco = tamanho de dados útil + Tamanho dos metadados + fragmentação (uso do espaço no arquivo em termos de du ).
Para relatar o uso do disco em vez do tamanho real:
# du -sh Data/
2.0T Data/
Agora, informe o tamanho do arquivo útil:
# du -sb Data/
1650071895576 Data/
Qual é 1,5Tb, o que significa que 0,5 Tb é usado para metadados (meta blocos, por exemplo, inodes) e fragmentos de cauda em blocos, que são alocados, mas não usados no final do arquivo (true para todos os arquivos com tamanho não divisível sobre o tamanho do bloco). Tendo 2M de arquivos vezes tamanho de bloco de 4096 com fragmentação média de dizer ~ 512b pode-se explicar 0,5 - 1Tb de espaço em disco "perda". Portanto, dados contíguos economizam espaço.
Por favor veja também man for
-b, --bytes
equivalent to '--apparent-size --block-size=1'