remove as duplicatas exatas de uma coluna, mantendo a primeira usando apenas sed / awk / other

0

meu arquivo é assim (a coluna 4 contém as duplicatas):

  1 14874 rs552113149 DDX11L1:100287102|WASH7P:653635
    1 14877 rs879239454 DDX11L1:100287102|WASH7P:653635
    1 16682 rs12405913 WASH7P:653635
    1 16688 rs868272296 WASH7P:653635
    1 16807 rs2974805 WASH7P:653635
    1 67580 rs571658168 OR4F5:79501
    1 67588 rs554549312 OR4F5:79501
    1 785283 rs552229741 LOC100287934:100287934|LOC105378580:105378580
    1 785301 rs192903943 LOC100287934:100287934|LOC105378580:105378580

Eu gostaria de remover duplicatas e substituir por um "." ou algum tipo de espaço reservado, então é assim:

  1 14874 rs552113149 DDX11L1:100287102|WASH7P:653635
    1 14877 rs879239454 .
    1 16682 rs12405913 WASH7P:653635
    1 16688 rs868272296 .
    1 16807 rs2974805 .
    1 67580 rs571658168 OR4F5:79501
    1 67588 rs554549312 .
    1 785283 rs552229741 LOC100287934:100287934|LOC105378580:105378580
    1 785301 rs192903943 .

Obrigado pela sua ajuda.

    
por Gordon Daly 30.04.2018 / 16:50

0 respostas

Tags