Uma possível fonte de confusão é GB vs. GiB / TB vs. TiB (base 10 / base 2), mas isso não explica toda a diferença aqui.
O Ceph / RBD tentará alocar espaço para seus volumes "preguiçosamente". É por isso que, embora você tenha criado quatro volumes de 5TB, ele reporta 16TB usados, não 20. Mas 16TB é mais do que a soma dos conteúdos "ativos" dos sistemas de arquivos suportados pela RBD, que é de apenas 11TB, como você diz. Várias coisas para anotar:
Quando você apaga arquivos em seus sistemas de arquivos suportados por RBD, os sistemas de arquivos irão marcar internamente os blocos como livres, mas geralmente não tentam "retorná-los" para o dispositivo de bloco subjacente (RBD). Se a versão do kernel do RBD for recente o suficiente (3.18 ou mais recente), você poderá usar fstrim
para retornar blocos liberados para o RBD. Eu suspeito que você tenha criado e excluído outros arquivos nesses sistemas de arquivos, certo?
Existe também alguma sobrecarga no sistema de arquivos além do uso de dados da rede mostrado por df
. Além de "superblocos" e outras estruturas de dados internas do sistema de arquivos, é esperado que haja alguma sobrecarga da granularidade na qual o RBD aloca dados. Eu acho que o RBD irá sempre alocar pedaços de 4MB, mesmo quando apenas uma parte dele é usada.