Perguntas sobre 'bioinformatics'

2
respostas

como mapear snps para ref gene

Eu tenho o seguinte conjunto de dados sobre o ID snps POS ID 78599583 rs987435 33395779 rs345783 189807684 rs955894 33907909 rs6088791 75664046 rs11180435 218890658 rs17571465 127630276 rs17...
20.01.2017 / 01:06
5
respostas

awk in while statement

Eu tenho a seguinte entrada: cat moldata >species_1 ?????????CACTTGGArGGTGGAGCCAAGAAGGTTATTATTTCTGCTCCCAGTGCTGACGCGCCCATGTACGTGGTC TGTCAACCTCGATTCTTATGACCCATCTGCTAAGGTCATTTCGAATGCTTCCTGCACCACCAACTGCCTCGCTCCCCT >species_2 CCAAGGTCATCCAT...
19.12.2016 / 18:31
1
resposta

Adicionando mais informações a uma string

Eu tenho um arquivo gtf como este: ChrI Coding_transcript gene 8451772 8509212 . - . gene_id "UMM-S589-0.12-gene-1" ChrI Coding_transcript exon 8501974 8509212 . - . gene_id "UMM-S5...
24.08.2018 / 20:14
1
resposta

compute soma cada 2 linhas e as substitui por outro valor se a soma for menor que um valor específico

Eu tenho uma matriz genotípica (com espaço tabular), com 2 milhões de linhas e 12 colunas. Colunas são indivíduos e as linhas são SNPs. Eu tenho 2 linhas por cada SNP para cada indivíduo, um é o número de alelo de referência e o outro número de...
08.12.2017 / 20:05
2
respostas

compara e imprime os valores em dois arrays usando awk

A01 11814111 11814112 GA AA A01 11485477 11485519 AG AT A01 11667935 11667971 TC TA A01 11876070 11876079 TC TG A01 11613258 11613277 A...
30.10.2017 / 21:10
2
respostas

Manipulação de tabelas

Eu tenho três arquivos com coordenadas do genoma e a última coluna como nomes comuns Arquivo 1. X 1 100 B Y 101 200 B Z 1 50 B Arquivo 2. X 200 300 A Y 101 200 A Z 1 50 A Arquivo 3. X 1 100 C Y 200 300 C Z 1 50 C Eu gost...
09.10.2017 / 16:24
1
resposta

Mesclando colunas específicas de 2 arquivos com base na correspondência de campo

Eu sei que não sou o primeiro a perguntar isto, mas o meu código ainda não funciona: Arquivo 1: gi|1283| tRNAscan exon 87020 88058 . - . transcript_id "Parent=tRNA-Tyr5.r01"; gi|3283| tRNAscan exon 97020 97058 . + . transcript_id "Parent...
20.06.2016 / 10:10
1
resposta

extrai entradas fasta da lista usando enquanto lido

Eu tenho 28 arquivos, cada um com ~ 14.000 "entradas". Uma única entrada consiste em um cabeçalho, denotado por > string, uma nova linha e, em seguida, uma sequência que é uma string. Cada entrada tem sequência / sequência de comprimento vari...
13.12.2017 / 21:54
0
respostas

use gff2fasta em vez de um script bash para obter partes de sequências de DNA de um genoma completo

EDIT e uma solução Como minha pergunta original foi mal formulada e eu estava tentando reinventar a roda, estou respondendo minha própria pergunta agora (talvez ajude alguém): O gff2fasta é uma ferramenta que faz exatamente o que eu prec...
07.04.2017 / 10:22
0
respostas

Como explodir vários arquivos fasta e mover os arquivos com 50 a 90% de similaridade com outra pasta?

Então eu tenho cerca de 100 arquivos fasta para explodir e eu preciso encontrar arquivos com 50 a 90% de semelhanças com o arquivo de banco de dados. Em seguida, os arquivos devem ser movidos para uma nova pasta. Como faço isso?     
05.04.2016 / 08:10