Você pode usar awk
, caso queira que todos os duplicados sejam localizados na posição # 4 (assumindo dados delimitados por espaços em branco):
$ awk '{seen[$4]++} END{for(x in seen) print x, seen[x]}' infile
other 2
Mus_musculus_tRNA-Gly-GCC-2-2 1
Mus_musculus_tRNA-Gly-GCC-2-7 1
mmu-mir-10a 1
mmu-mir-10b 2
tRNA-His 1
Mus_musculus_tRNA-Gly-GCC-4-1 2
Os primeiros campos são os dados e o segundo arquivo é duplicados correspondentes.