É sua localidade, prefixar seu comando sort com uma configuração de localidade que especifica a ordem de agrupamento desejada
$ cat test2.txt
a/d
a/a
a/c
a//c
$ sort test2.txt
a/a
a/c
a//c
a/d
$ LANG=C sort test2.txt
a//c
a/a
a/c
a/d
man sort
diz
*** WARNING *** The locale specified by the environment affects sort
order. Set LC_ALL=C to get the traditional sort order that uses native
byte values.
O GNU diz
Most of the language specific locales have tables that specify the sort behavior to ignore punctuation and to fold case. This is counter intuitive to most long time computer users!
NOTA
Se seus milhões de URLs contiverem caracteres não-ASCII (o que os tornaria realmente IRIs ), você poderá ser indesejado resultados usando uma classificação de valor de byte. Você pode usar codificação de URL para evitar esse problema, com o risco de tornar os URLs difíceis para os humanos lerem. / p>