Perguntas sobre 'bioinformatics'

3
respostas

Pegue os primeiros 10 caracteres de strings em um arquivo fastq

estou tentando selecionar de um arquivo fastq apenas os primeiros 10 nucleotídeos das leituras: Input: @RONSP:03887:07268 GTAGTTATCTGAAAGGATGCATGGGAAAATTTCAATATTTTTGTATCTGTTGAGGACTTTTTTGTGAGTGACTATATGGTCAATTTTGGAGGATTTGGTACTGAG + 69;::5:...
24.02.2017 / 17:47
3
respostas

extrair informação de uma coluna [fechada]

Eu tenho um arquivo que se parece com isso: chr1 HAVANA exon 12613 12721 . + . gene_id "ENSG00000223972.5"; transcript_id "ENST00000456328.2"; gene_type "transcribed_unprocessed_pseudogene"; gene_name "DDX11L1"; transcript_ty...
11.09.2018 / 00:11
1
resposta

Extraindo linhas contendo padrão + próxima linha

Eu tenho dois arquivos: um contendo uma lista de IDs (arquivo A) e outro contendo uma lista de IDs mais seu texto correspondente - que está sempre na próxima linha - (arquivo B). Arquivo A: >161@1983 >947@2009 >59@2002 >5933@20...
07.05.2018 / 03:14
2
respostas

Remove linhas que contêm cadeias duplicadas entre os primeiros 4 caracteres de duas colunas

Eu tenho um arquivo grande que contém 4 colunas e 7.000 linhas. Eu preciso remover as linhas em que o início da segunda coluna é o mesmo que o início para a quarta coluna. Entrada: Gator_locus75 AATTCCATGTACG Gator_locus23 CTAGAGGAAG...
12.02.2018 / 21:10
2
respostas

copie os nomes das seqüências de DNA em um arquivo de árvore filogenética e adicione os nomes das espécies a ele

De um arquivo parecido com este: (AJirio_TR15329|c4_g1_i4|m.30470:0.00230,(AJama_TR16613|c5_g2_i2|m.30203:0.00171,(AJkago_TR11651|c5_g2_i1|m.3847:0.00057,AJtok_TR11413|c7_g1_i1|m.3527:0.00033)1.00 :0.00080)0.94 :0.00085,Atab_TR15364|c0_...
09.01.2018 / 16:18
3
respostas

rearranje a saída IO do primer3 boulder

Estou tentando reorganizar a saída primer3_core . Por exemplo: SEQUENCE_ID=ID_1 PRIMER_LEFT_0_SEQUENCE=ACGTGTAGCGGTTCAGACG PRIMER_RIGHT_0_SEQUENCE=ACCATGCATGATCCATCCAGG PRIMER_LEFT_1_SEQUENCE=CACAGCCACAGCAGCACAC PRIMER_RIGHT_1_SEQUENCE=A...
02.10.2017 / 15:53
2
respostas

Localizar e substituir linhas no arquivo de texto com saída de outro arquivo

Eu tenho dois arquivos A e B. File A >Node1 ... >Node2 ... File B >gb|KY551314.1| Influenza A virus (A/mallard/Idaho/AH0011522/2015(H7N7)) segment 2 polymerase PB1 (PB1) and PB1-F2 protein (PB1-F2) genes, complet...
15.05.2017 / 20:23
1
resposta

Como extrair valores que são menores que 0 e ponto de colunas específicas e imprimir a linha inteira usando awk

Eu tenho um arquivo delimitado por tabulações, quero extrair entradas "exônicas" da segunda coluna, entradas "não sinonais SNV" da terceira coluna e valores menores que (< 1) e ponto (.) da coluna 4ª, 5ª 7ª Chr Func.refGene ExonicFu...
28.04.2017 / 14:09
2
respostas

Obtém as linhas apenas com campos específicos

#CHROM POS T1 T10 T11 T12 T13 T2 T3 T4 T5 T6 T106 T107 T108 T109 T110 T112 T114 T116 T120 T122 T125 T128 T129 T130 Aradu.A01 300806 H B...
06.01.2017 / 17:31
1
resposta

Sintaxe para expressão regular procurando códons de DNA

Eu tenho que escrever um script para uma atribuição que irá tomar o nome do arquivo como um comando e saída de cada códon único de 3 bases no arquivo e quantas vezes ele ocorre em ordem decrescente. O script tem que verificar se ele tem um argum...
28.10.2018 / 21:01