Testado com GNU sort
do GNU coreutils 8.26, não tive nenhum problema em classificar um arquivo de 5GiB. Então, você poderia tentar instalar aquele.
Coisas a ter em mente:
-
sort -u
não oferece linhas exclusivas, mas uma de todas as linhas que ordenam o mesmo. Nos sistemas GNU, especialmente em sua localidade típica, existem vários caracteres que ordenam o mesmo. Se você quiser linhas exclusivas em nível de byte, useLC_ALL=C sort -u
. -
sort
usa arquivos temporários para grandes entradas para classificar em partes para não usar toda a memória. Se você não tiver espaço suficiente em seu diretório temporário (geralmente/tmp
, a menos que tenha definido$TMPDIR
), ele falhará. Defina$TMPDIR
(veja também a opção-T
com GNUsort
) para um diretório com espaço livre suficiente.