Espaço de folga do cluster
Você não pode acessar cada byte individual em um meio de armazenamento separadamente. Fazer isso seria terrivelmente ineficiente, porque o sistema precisa de algum modo de monitorar quais são usados e quais são gratuitos (ou seja, uma lista), portanto, fazer isso para cada byte separadamente criaria um excesso de escutas (para cada byte individual, ou seja, 1-para-1, a lista seria tão grande quanto o próprio meio!)
Em vez disso, o meio é dividido em pedaços, blocos, unidades, grupos, o que você quiser chamá-los (o termo técnico é clusters ), cada um contendo um número consistente de bytes (normalmente é possível especificar o tamanho dos clusters, já que diferentes usos exigem tamanhos diferentes para reduzir o desperdício).
Quando um arquivo é salvo em disco, o tamanho do arquivo é dividido pelo tamanho do cluster e arredondado para cima , se necessário. Isso significa que, a menos que o tamanho do arquivo seja exatamente divisível pelo tamanho do cluster, algumas partes do cluster não serão usadas e, portanto, serão desperdiçadas.
Quando você visualiza as propriedades de um arquivo, você vê o tamanho real do arquivo, bem como o tamanho que ele ocupa no disco, o que inclui qualquer “ slack ”, isto é, as “dicas de cluster” que não são usadas. Isso geralmente não é muito por arquivo e o tamanho no disco geralmente será quase igual ao tamanho real, mas quando você soma o espaço desperdiçado de todos os milhares de arquivos em uma unidade, eles podem adicionar. Portanto, quando você visualiza o tamanho de uma pasta grande, especialmente um com muitos arquivos menores que um cluster, o tamanho no disco (ou seja, a quantidade de espaço em disco marcado como usado) pode ser significativamente maior do que o real tamanho (ou seja, o espaço necessário para os arquivos reais).
Em um caso como o acima, o que você pode tentar é reduzir o tamanho do cluster para que cada arquivo desperdice menos espaço. Geralmente, uma unidade com a maioria dos arquivos perdidos deve usar o menor tamanho de cluster possível (para reduzir o desperdício) e uma unidade com arquivos grandes deve usar o maior tamanho de cluster possível (dessa forma, as estruturas de contabilidade são menores). p>
Mesmo em um nível inferior, se cada cluster for apenas um único setor , a menos que um arquivo seja um múltiplo exato de o tamanho dos setores na unidade (geralmente 512 bytes tradicionalmente, agora com 4.096 discos Advanced Format ), então haverá ainda será espaço não utilizado entre o final do arquivo e o fim do setor.
Compressão
Outro cenário em que você pode ver uma diferença entre o tamanho real do arquivo e o tamanho no disco é com a compactação. Quando uma unidade é compactada (por exemplo, usando o DriveSpace , compactação NTFS , etc.) então haverá uma diferença entre o tamanho do arquivo real (que precisa ser conhecido) eo tamanho real que o arquivo ocupa (ou seja, usa ou “pega”) no disco.
Atalhos e Hardlinks
No entanto, outro cenário que pode resultar em uma diferença é com hardlinks . Com sistemas de arquivos que suportam hardlinks, quando um arquivo duplicado é criado, em vez de criar um arquivo totalmente novo que ocupa espaço para si mesmo, o sistema de arquivos cria um atalho para o arquivo para que ambos (ou todos os três, etc.) As cópias apontam para o mesmo arquivo físico no disco. Portanto, quando há dois arquivos apontando para os mesmos dados, cada um deles tem o mesmo tamanho, mas ocupa apenas um pouco mais do que o espaço para armazenar uma única cópia.