Perguntas sobre 'bioinformatics'

1
resposta

Obtendo o arquivo fasta correspondido

list.txt : 58759__len__2903 58759__len__2903 673957__len__1655 673957__len__1655 3566454__len__1744 seq.fasta : >58759__len__2903 TTTTCCGTAGAGGAGATCCCTATTTTTAGGTTTGTAAGAGATCATTTT >67777__len__2978 TTTTTAGGTTTGTAAGACCGTAGAG...
22.09.2014 / 10:57
3
respostas

maneira de selecionar linhas que mostram variações

Eu tenho um arquivo enorme que contém 80 genomas e cinco cromossomos. Eu queria saber se há uma maneira fácil de selecionar apenas as linhas de um cromossomo (por exemplo, 1), mas apenas na posição que mostra as VARIAÇÕES de SNP. 1 180754...
28.04.2014 / 16:40
4
respostas

Apaga tudo após o segundo sublinhado

Eu quero excluir todo o texto após o segundo sublinhado (incluindo o próprio sublinhado), mas não em todas as linhas. Cada uma das linhas de destino começa com um padrão (> gi_). EXEMPLO. Entrada >gi_12_pork_cat ACGT...
12.06.2017 / 20:19
3
respostas

Imprime texto antes e depois da correspondência, de um início específico e até uma sequência final

Estou tentando extrair entradas de um grande arquivo Genbank, com milhares de entradas. Para uma string de pesquisa, estou usando um nome de gene único - que funciona bem. O problema é que eu gostaria de imprimir a entrada inteira para esse gene...
29.04.2018 / 22:12
5
respostas

Altera um caractere em uma coluna dependendo de uma instrução de outra coluna

Estou tentando configurar um script que converterá uma sequência de códon em outra sequência de códon, dependendo das variantes que encontrar em meus dados NGS. Atualmente, o My script cria um arquivo de saída delimitado por tabulação, com 6...
01.01.2018 / 20:13
1
resposta

concatenando múltiplos arquivos fastq

Eu tenho uma pasta com quase 100 arquivos, organizados em grupos de 16 arquivos cada. Eu preciso concatenar cada um dos 16 arquivos de cada grupo em um único arquivo. Por exemplo, um grupo de nomes de arquivos é: randomString_$groupName-...
26.09.2017 / 10:03
3
respostas

Remover pedaço de linhas de acordo com números de série

Estou processando arquivos fastq a partir de dados de sequenciamento de próxima geração organizados da seguinte forma: Linha 1 informações sobre a máquina seqüenciadora, a pista, as "peças" e o número da leitura Row 2 informações sobre a s...
16.06.2017 / 11:32
3
respostas

mesclando dois arquivos de acordo com uma coluna comum

Eu tenho 2 arquivos. Arquivo1 é: chr19 4124051 4124250 1 chrX 154458151 154458200 2 chr22 37019451 37019600 3 chr15 74995401 74995550 4 chr12 128823901 128824100 5 e o arquivo 2 é: chr19 4124051 4124250...
07.06.2017 / 16:50
1
resposta

Como encontrar caracteres entre duas cordas e anexá-las com algum texto ao fim da linha?

Estou lidando com arquivos fasta com linhas como: \>97977-100;sample=Samp1 TAATGATGATTTGT \>97978-60;sample=Samp2 AACATTCAACGCGGTCGGTGAGTA \>97979-30;sample=Samp3 AACCGTAGGAGTTGATGTGCGGT \>97980-20;sample=Samp4 ACTGT...
25.01.2018 / 17:06
3
respostas

extrai linhas que correspondem a uma lista de palavras em outro arquivo

Eu tenho o arquivo 1 com essas linhas: ATM 1434.972183 BMPR2 10762.78192 BMPR2 10762.78192 BMPR2 1469.14535 BMPR2 1469.14535 BMPR2 1738.479639 BMS1 4907.841667 BMS1 4907.841667 BMS1 880.4532628 BMS1 880.4532628 BMS1P17 1249.75 BMS1P17 1249.75...
25.07.2018 / 20:59