O que funcionou melhor para mim, como sempre terei duplicatas e a numeração (campos -f) sempre mudará, assim como o fato de minha lista poder ter centenas de campos, cut
não estava provando ser uma opção válida.
Isso é o que produziu o que eu queria:
sed -e 's/\s\+/\n/g' data.txt > data_cr.txt && sort data_cr.txt | uniq -d > final.txt
Onde:
sed -e 's/\s\+/\n/g' data.txt > data_cr.txt
força todo o texto, separado por espaços, em sua própria linha e o grava em um novo arquivo data_cr.txt ... e
sort data_cr.txt | uniq -d > final.txt
pega os dados de linha por linha e imprime apenas uma única cópia de qualquer duplicata.