Você está definindo LC_COLLATE
apenas para o comando cat
(que não faz uso dele), enquanto precisa defini-lo para sort
e uniq
.
Além disso, você pode precisar definir LC_CTYPE
para algo utf-8, caso contrário, isso causará confusão. Eu definiria LC_ALL
como en_US.UTF-8
uniq -u
reporta apenas linhas exclusivas . Então, se todas as palavras de uma só letra aparecerem várias vezes, é normal que elas não apareçam.
No meu sistema, épée aparece duas vezes:
$ cat american-english british-english | sort | grep -x 'épée'
épée
épée
Talvez você quisesse dizer sort | uniq
ou sort -u
.