Este é o problema, estou verificando domínios para meu rastreador, eu tenho 145 milhões de domínios para enganar a verificação em tempo real.
Armazenamento consumido:
80GB for 19 million files
Para fazer isso, estou criando uma estrutura de diretórios fora das primeiras quatro letras do domínio e, em seguida, criando um arquivo de um byte, significando que eu já vi esse domínio antes.
s/u/p/e/superuser.com
Eu crio a estrutura de diretórios como acima para evitar que qualquer diretório tenha uma quantidade irracional de arquivos ...
Detalhes do local do domínio / arquivo:
Domain: superuser.com
Root Directory: /home/tmc/tech/Data/Dupes/Domains/
Directory: s/u/p/e/
File Path: s/u/p/e/superuser.com
File Contents: .
Agora, suspeito strongmente que o uso de armazenamento de alguma forma tem algo a ver com a quantidade de diretórios e arquivos sendo criados, no entanto, criar apenas os diretórios não resulta em uso extremo de armazenamento, então tem algo a ver com esses diretórios preenchidos, novamente, estou tentando descobrir isso, é o que eu suspeito neste momento.
Alguém pode me explicar como o sistema de arquivos linux ext4 funciona em termos de consumo de armazenamento em relação a diretórios, arquivos e diretórios preenchidos com arquivos?