Perguntas sobre 'bioinformatics'

3
respostas

Como mesclar dois arquivos com base na correspondência de duas colunas?

Eu tenho gostos de arquivo1: 0 AFFX-SNP-000541 NA 0 AFFX-SNP-002255 NA 1 rs12103 0.6401 1 rs12103_1247494 0.696 1 rs12142199 0.7672 E um arquivo2: 0 AFFX-SNP-000541 1 0 AFFX-SNP-002255 1 1 rs12103...
06.02.2014 / 21:03
1
resposta

Melhor distribuição Linux para computação científica? [fechadas]

Eu comprei recentemente um novo laptop para ser usado em pesquisas científicas quando estou em casa. A máquina tem processador Intel i7 com 8 núcleos, 4 GB de RAM e uma placa gráfica da Nvidia (2 GB, Ivy Bridge). Os programas que mais preciso pa...
16.05.2013 / 15:10
5
respostas

Executando um comando em muitos arquivos

Eu tenho uma pasta com muitos arquivos (xyz1, xyz2, até o xyz5025) e preciso executar um script em cada um deles, obtendo xyz1.faa, xyz2.faa e assim por diante. saídas. O comando para um único arquivo é: ./transeq xyz1 xyz1.faa -table 11...
01.07.2017 / 22:11
8
respostas

Como contar o número de caracteres em uma linha, exceto um caractere específico?

Este é um arquivo de peça N W N N N N N N N N N N C N N N N N N N N N N A N N N N N N N N N N N N N N N N N N N N N G N N N N N N N N N N C N N N C N N N N N N C C N N N N N N N N Em cada linha, quero contar o número total de todos os car...
06.10.2017 / 22:39
2
respostas

Encontre qualquer linha no VI que tenha algo diferente de ATCG

Eu tenho um arquivo de dados genômicos que tem aproximadamente 5 milhões de linhas e deve ter apenas os caracteres A, T, C e G nele. O problema é que eu sei o tamanho do arquivo, mas é um pouco maior que isso. O que significa que algo deu errado...
31.08.2018 / 17:42
4
respostas

Como juntar dois arquivos com diferentes números de linhas no shell?

Eu tenho file1 assim: CHR SNP TEST A1 A2 GENO O(HET) E(HET) P 0 AFFX-SNP-000541 ALL 0 0 0/0/0 nan nan 1 0 AFFX-SN...
06.02.2014 / 18:56
5
respostas

Extrai a posição inicial e final de um identificador comum

Eu tenho um arquivo assim: Id Chr Start End Prom_1 chr1 3978952 3978953 Prom_1 chr1 3979165 3979166 Prom_1 chr1 3979192 3979193 Prom_2 chr1 4379047 4379048 Prom_2 chr1 4379091 4379092 Prom_2...
19.12.2016 / 19:13
2
respostas

Extrai o número do comprimento n do campo e da string de retorno

Eu tenho um arquivo delimitado por tabulações com uma combinação de texto e números. Eu quero manter cada linha como está, mas quero manter apenas os números de seis dígitos na quinta coluna, se presentes. Por exemplo: gene1 NM_033629 598...
11.10.2017 / 18:11
4
respostas

Remove string de um campo em particular usando awk / sed

Eu tenho um arquivo (> 80.000 linhas) que parece assim: chr1 GTF2GFF chromosome 1 249213345 . . . ID=chr1;Name=chr1 chr1 GTF2GFF gene 11874 14408 . + . ID=DDX11L1;Note=unknown;Name=DDX11L1 chr1 GTF2GFF exon...
26.04.2013 / 15:49
2
respostas

contando múltiplos padrões em uma única passagem com grep?

Eu escrevi um loop de grep para contar os trinucleotídeos de DNA em um arquivo fasta de DNA compactado contendo seqüências de DNA, por exemplo declare -a tri=(AAA AAC AAG AAT CAA .. etc) for i in ${tri[@]} do gzip -cd gencode.v18.pc_trans...
11.02.2014 / 13:28