To access files on ext3, and (if dir_index is not being used) what is the optimal directory depth vs the number of files per directory?
Você desejará executar seus próprios testes de desempenho para isso.
Does file size effect this? The total number of files might be a factor, but there still should be an equation I think...
O tamanho do arquivo não afeta isso, esta é uma função relacionada ao número de entradas do cabeçalho do arquivo para qualquer sistema de arquivos que você esteja usando.
If you don't have the benchmarks to back it up, I would still be interested in what you think might be optimal and why?
32.000 arquivos é praticamente o limite superior, mas a partir da minha própria experiência empírica, sugiro menos de 10.000 arquivos, a menos que você queira esperar um ou dois minutos. Alguns milhares podem ser feitos em cerca de 5 a 20 segundos, dependendo da carga de I / O e do servidor, etc. Algumas centenas, quase instantaneamente.
Edição de acompanhamento (para comentário postado):
Ter 8 diretórios de 2.500 arquivos cada um é longe melhor do que ter dois diretórios de 10.000 arquivos cada. O segredo está em reduzir o tempo de busca em cada diretório.
Por incrível que pareça, eu acabei de postar uma resposta semelhante a uma pergunta semelhante aqui .