Acabei escrevendo um pequeno script python para calcular a correlação entre nomes de diretório e inodes, inodes e blocos de dados e nomes de diretórios para blocos de dados. Acontece que o ext4 tende a ter uma correlação bastante fraca entre a ordem em que os nomes de arquivos aparecem no diretório e onde eles são armazenados no disco. Depois de discuti-lo na lista de discussão ext4, verifica-se que este é o resultado dos índices de diretório hash usados para acelerar pesquisas em diretórios grandes. Os nomes são armazenados em ordem de hash, o que efetivamente embaralha sua ordem em relação a qualquer outra coisa.
Parece-me e pelo menos um outro comentarista que isso é uma deficiência no fs que deve ser corrigido. Ted Ts'o (o mantenedor de ext.) Acha que seria muito difícil fazer isso no fs, e que boas ferramentas (como rsync e tar) devem ter a opção de ordenar o diretório pelo número do inode antes de ler os arquivos.
Portanto, parece que as solicitações de aprimoramento de recursos precisam ser arquivadas para rsync e tar.