arquivo1:
a, 1
b, 5
c, 2
f, 7
arquivo2:
a, 2
f, 9
g, 3
Eu quero juntar o arquivo 1 e o arquivo 2 com base na coluna 1 e obter o arquivo 3 conforme abaixo.
arquivo3:
a, 1, 2
b, 5, -
c, 2, -
f, 7...
O código está sendo usado para remover entradas duplicadas do arquivo histroy.txt que contém o histórico da linha de comando.
BEGIN{
if (data[$0]++ == 0)
lines[++count] = $0;
}
END {
for(i=1; i<count; i++)...
Eu tenho dois arquivos, o primeiro deles (delimitado por tabulação):
1 100 371 R1,R2,R4 12
5 167 16 R2,R5 5
8 242 490 R1,R3,R4 11
outro se parece com:
R1 0.167
R2 0.171
R3 0.156
R4 0.162...
Eu tenho um arquivo com esse tipo de conteúdo:
bla bla
pattern2
bla
pattern1
pattern2
blabla pattern1 bla
bla
pattern1
Eu gostaria de remover toda a linha em negrito, ou seja, contém a primeira ocorrência de pattern1...
Eu tenho um arquivo com 250k linhas e 10 colunas como:
img1 aa bb cc ...
img2 aa yy dd ...
img3 uu bb ee ...
img4 NA bb tt ...
Eu quero um script que converta este arquivo para:
img1 1 1 1 ...
img2 1 2 2 ...
img3 2 1 3 ...
img4 0 1 4 ....
Eu tenho pasta que contém dados separados por pipe (|). Eu quero ter uma lista da 8ª coluna na primeira linha de cada arquivo na pasta junto com o nome do arquivo, seria bom se todos esses dados pudessem ser consolidados em um arquivo
Acabei de encontrar uma fórmula que pode ser usada para descompactar arquivos fasta. Antes de dar a fórmula, preciso explicar o que é desdobrar um arquivo fasta.
Em suma, o formato fasta é assim:
>name_of_sequence$
xxxxxxxxxxxxxxxxxxxxxx$...
Isto dá o resultado 124:
awk 'BEGIN {FS = ","; count = 0}; { if ($7 ~ /Nature Life/) { count++ }} END {print count}' file.csv
Isso dá resultado 123:
grep -cE '^([^,]*,){6}[^,]*Nature Life' file.csv
O arquivo é muito grande para s...
Eu quero remover as linhas duplicadas que começam com > e a próxima linha depois disso.
Por exemplo:
>1
ACCGGTTTCCTTGAAATT
>2
AACCTTCCGGTTAATT
>3
AACCTTCCGGTTAATT
>1
ACCGGTTTCCTTGAAATT
Como você pode ver, eu tenho...