essa é uma solução awk
, que mantém as linhas onde elas são repetidas mais de uma vez. Se você quiser aquelas que são repetidas exatamente duas vezes, altere >1
para ==2
awk -F'|' 'NR==FNR{s[$1]++;next} (s[$1]>1)' infile infile
100036501|F|0--44:C>T something
100036501|F|0-44:C>T-44:C>T something
100036508|F|0--66:T>G something
100036508|F|0-66:T>G-66:T>G something
100036516|F|0--15:T>G something
100036516|F|0-15:T>G-15:T>G something