Como deletar linhas contendo alguns nomes em uma coluna em arquivos txt

Question

Como deletar linhas contendo alguns nomes em uma coluna em arquivos txt

#1 resposta do (2 votos)

0

Tenho alguns arquivos de texto grandes delimitados por tabulações:

#CHR  POS  REF  ALT    EFC                         GOM
1    100   A    G     u_v(XXXXXX);i_v(XXXXXXX)     0
2    465   T    C     d_r(XXXXXX);i_r(XXXXXXXX)    1
9    600   T    G     d_i(XXXXXX);f_v(XXXXXXXX)    -

Eu quero excluir as linhas que

(1) o conteúdo da coluna "EFC" contém "i_r" ou "u_v" (até há também "(XXXXXX)" e outras coisas lá)

ou

(2) os valores na coluna "GOM" igual a 1.

Então, como obter os arquivos esperados usando o awk ou sed?

text-processing awk sed csv

por MagicPants 26.07.2017 / 13:15

1 resposta

Tags text-processing awk sed csv

Compare a similaridade ou a distância entre cada par de linhas dentro de um arquivo? Problema para instalar a versão mais recente da shellcheck do tar.xz

score 2 · Accepted Answer

Diretamente traduzido para o awk:

awk -F'\t' '!($5 ~ /i_r/ || $5 ~ /u_v/ || $6 == 1) { print; }' input

Defina o separador de campos para a guia \t
Se as seguintes condições não forem true !( ... )
Condição 1: o campo 5 contém i_r ou
Condição dois: o campo 5 contém u_v ou
Condição três: o campo 6 é 1 e, em seguida,
print da linha

As linhas que correspondem a qualquer uma das condições não serão impressas ("excluídas").

Exemplo de saída:

#CHR    POS     REF     ALT     EFC     GOM
9       600     T       G       d_i(XXXXXX);f_v(XXXXXXXX)       -