Perguntas sobre 'awk'

awk é uma linguagem de programação interpretada para fins especiais para extração e relatório de dados.
1
resposta

Como substituir um delimitador entre dois outros delimitadores?

Eu tenho string como abaixo: engineer,doctor,"987,345,123",engineer Eu queria mudar para abaixo no unix: engineer,doctor,"987345123",engineer     
28.07.2017 / 18:12
7
respostas

Exclui uma linha contendo a primeira ocorrência de "pattern1" após a última ocorrência de "pattern2"?

Eu tenho um arquivo com esse tipo de conteúdo: bla bla pattern2 bla pattern1 pattern2 blabla pattern1 bla bla pattern1 Eu gostaria de remover toda a linha em negrito, ou seja, contém a primeira ocorrência de pattern1...
09.08.2017 / 18:42
3
respostas

Substitua cada valor único em todas as colunas por um identificador exclusivo

Eu tenho um arquivo com 250k linhas e 10 colunas como: img1 aa bb cc ... img2 aa yy dd ... img3 uu bb ee ... img4 NA bb tt ... Eu quero um script que converta este arquivo para: img1 1 1 1 ... img2 1 2 2 ... img3 2 1 3 ... img4 0 1 4 ....
16.09.2017 / 21:19
3
respostas

Localizando dados de todos os arquivos na pasta

Eu tenho pasta que contém dados separados por pipe (|). Eu quero ter uma lista da 8ª coluna na primeira linha de cada arquivo na pasta junto com o nome do arquivo, seria bom se todos esses dados pudessem ser consolidados em um arquivo     
03.03.2017 / 07:09
2
respostas

ajuda a entender uma fórmula do awk que descompacta arquivos fasta

Acabei de encontrar uma fórmula que pode ser usada para descompactar arquivos fasta. Antes de dar a fórmula, preciso explicar o que é desdobrar um arquivo fasta. Em suma, o formato fasta é assim: >name_of_sequence$ xxxxxxxxxxxxxxxxxxxxxx$...
19.02.2017 / 17:58
2
respostas

resultados diferentes de awk e grep

Isto dá o resultado 124: awk 'BEGIN {FS = ","; count = 0}; { if ($7 ~ /Nature Life/) { count++ }} END {print count}' file.csv Isso dá resultado 123: grep -cE '^([^,]*,){6}[^,]*Nature Life' file.csv O arquivo é muito grande para s...
18.10.2015 / 18:27
3
respostas

Como remover linhas duplicadas que começam com um padrão e a próxima linha depois disso?

Eu quero remover as linhas duplicadas que começam com > e a próxima linha depois disso. Por exemplo: >1 ACCGGTTTCCTTGAAATT >2 AACCTTCCGGTTAATT >3 AACCTTCCGGTTAATT >1 ACCGGTTTCCTTGAAATT Como você pode ver, eu tenho...
23.09.2015 / 17:29
2
respostas

Como adicionar propriedades no final das duas primeiras linhas com aspas duplas?

Queremos adicionar as seguintes propriedades: -XX:+UseGCLogFileRotation -XX:NumberOfGCLogFiles=5 -XX:GCLogFileSize=2M nas duas primeiras linhas que contêm a palavra - HBASE_MASTER_OPTS Exemplo antes da mudança : more ams-hbase-e...
13.08.2018 / 18:54
3
respostas

Grep / awk / sed para linhas compostas de apenas duas letras e linhas que começam com uma letra e atendem a um determinado comprimento

Não tenho certeza de quantas pessoas estão familiarizadas com os dados de sequenciamento de DNA, mas se isso fizer parte do meu arquivo (as linhas que começam com ">" são IDs e as linhas que começam com uma letra são sequências de DNA): &g...
02.06.2016 / 16:48
3
respostas

Como fazer um loop para processar dois arquivos de entrada

Estou usando o awk para fazer corresponder dois arquivos e depois multiplicar os elementos do arquivo2 e arquivo1. awk 'NR == FNR{a[$1]=$2; b[$1]=$3; next} /:/ || !NF{print; next} {print $1, $2*a[$1], $2*b[$1]}' file2 file1 > o...
09.06.2016 / 14:11