Haveria algum problema comigo salvando o potencial de cerca de 10 milhões de resultados em arquivos separados em um diretório?
Sim. Provavelmente há mais razões, mas estas posso postar no topo da minha cabeça:
-
tune2fs
tem uma opção chamadadir_index
que tende a ser ativada por padrão (no Ubuntu) que permite armazenar aproximadamente 100k arquivos em um diretório antes de você ver um desempenho atingido. Isso não é nem perto dos arquivos de 10m que você está pensando. -
ext
filesystems tem um número máximo fixo de inodes. Todo arquivo e diretório usa 1 inode. Usedf -i
para ver suas partições e inodes gratuitamente. Quando você ficar sem inodes, não poderá criar novos arquivos ou pastas.
Os comandos -
como
rm
els
ao usar curingas expandem o comando e terminam com uma "lista de argumentos longa demais". Você terá que usarfind
para excluir ou listar arquivos. Efind
tende a ser lento.
Ou é aconselhável dividi-los em pastas?
Sim. Definitivamente. Basicamente, você não pode nem armazenar arquivos de 10m em um diretório.
Eu usaria o banco de dados. Se você quiser armazenar em cache para um site, dê uma olhada em " solr " ("fornecendo indexação distribuída, replicação e balanceamento de carga consultando ").