Eu tenho um arquivo com esse tipo de conteúdo:
bla bla
pattern2
bla
pattern1
pattern2
blabla pattern1 bla
bla
pattern1
Eu gostaria de remover toda a linha em negrito, ou seja, contém a primeira ocorrência de pattern1...
Eu tenho um arquivo com 250k linhas e 10 colunas como:
img1 aa bb cc ...
img2 aa yy dd ...
img3 uu bb ee ...
img4 NA bb tt ...
Eu quero um script que converta este arquivo para:
img1 1 1 1 ...
img2 1 2 2 ...
img3 2 1 3 ...
img4 0 1 4 ....
Eu tenho pasta que contém dados separados por pipe (|). Eu quero ter uma lista da 8ª coluna na primeira linha de cada arquivo na pasta junto com o nome do arquivo, seria bom se todos esses dados pudessem ser consolidados em um arquivo
Acabei de encontrar uma fórmula que pode ser usada para descompactar arquivos fasta. Antes de dar a fórmula, preciso explicar o que é desdobrar um arquivo fasta.
Em suma, o formato fasta é assim:
>name_of_sequence$
xxxxxxxxxxxxxxxxxxxxxx$...
Isto dá o resultado 124:
awk 'BEGIN {FS = ","; count = 0}; { if ($7 ~ /Nature Life/) { count++ }} END {print count}' file.csv
Isso dá resultado 123:
grep -cE '^([^,]*,){6}[^,]*Nature Life' file.csv
O arquivo é muito grande para s...
Eu quero remover as linhas duplicadas que começam com > e a próxima linha depois disso.
Por exemplo:
>1
ACCGGTTTCCTTGAAATT
>2
AACCTTCCGGTTAATT
>3
AACCTTCCGGTTAATT
>1
ACCGGTTTCCTTGAAATT
Como você pode ver, eu tenho...
Queremos adicionar as seguintes propriedades:
-XX:+UseGCLogFileRotation -XX:NumberOfGCLogFiles=5 -XX:GCLogFileSize=2M
nas duas primeiras linhas que contêm a palavra - HBASE_MASTER_OPTS
Exemplo antes da mudança :
more ams-hbase-e...
Não tenho certeza de quantas pessoas estão familiarizadas com os dados de sequenciamento de DNA, mas se isso fizer parte do meu arquivo (as linhas que começam com ">" são IDs e as linhas que começam com uma letra são sequências de DNA):
&g...
Estou usando o awk para fazer corresponder dois arquivos e depois multiplicar os elementos do arquivo2 e arquivo1.
awk 'NR == FNR{a[$1]=$2; b[$1]=$3; next}
/:/ || !NF{print; next}
{print $1, $2*a[$1], $2*b[$1]}' file2 file1 > o...