Como seu arquivo parece estar classificado:
sort -m -u -k 1,2 < file
-m
para mesclagem não tenta classificar o arquivo, mas com -u
(para exclusivo ) combinado com -k 1,2
para especificar uma chave de classificação consistindo nos dois primeiros campos (use -k 1,19
para os primeiros 19 campos), estamos removendo duplicatas nos dois primeiros campos.
Se o arquivo não estiver classificado (pelo menos nesses dois campos), basta soltar o -m
. O resultado acabará sendo classificado embora. A classificação será dispendiosa, mas deverá ter um bom nível de memória, pois sort
recorre ao uso de arquivos temporários para classificar arquivos grandes (você precisa de espaço livre em disco em /tmp
(ou $TMPDIR
)).