Perguntas sobre 'bioinformatics'

3
respostas

Extrai coisa específica de cada linha na coluna

Eu tenho um arquivo com ~ 13K linhas, contendo duas colunas. Eu quero extrair os valores em 'phNAME': 'value' , mas cada linha pode ter mais de um phNAME . Caso haja mais de um phNAME em uma única linha, quero gravar cada valor phNAM...
23.07.2018 / 16:13
1
resposta

para loop para arquivos contendo caracteres específicos (“rem_trim”) no nome do arquivo

Eu gostaria de fazer um loop for nos arquivos abaixo, mas apenas para os arquivos que contêm " rem_trim " no nome. Os que acabaram de aparar foram feitos. Isso funcionou para os arquivos com acabamento, mas não rem_trim list='for i in *tri...
18.10.2017 / 16:48
1
resposta

condicional extraindo uma coluna

Eu tenho um Buch de arquivos (3300) que são o resultado da minha saída de varredura do genoma anacovis2_1_summary_betai_reg.out ... anacovis2_3300_summary_betai_reg.out e cada arquivo se parece com isso (poucas linhas): 1 4996 0.03...
19.10.2017 / 23:49
2
respostas

Para loops no Bash

Estou executando a ferramenta de bioinformática hmmer e gostaria de executá-la para mais de 7000 consultas de sequência de teste. Depois que ele executar cada um, eu gostaria que ele salvasse a saída em um arquivo de texto, o que é bastante fáci...
20.06.2017 / 22:00
1
resposta

Problema Aparando os caracteres finais

Eu tenho o seguinte script: #!/bin/bash SINGLE='cut -c 7-21 Data.txt' cd ../FASTA_SEC/ for i in ${SINGLE}; do if [ -r ../FASTA_SEC/${i}.fa ]; then HEAD='sed -n 2p ../FASTA_SEC/${i}.fa | head -c 3' TAIL='tail -c 4 ../FAS...
11.01.2017 / 22:19
1
resposta

Criando uma lista contendo nomes de arquivos com caminhos

Eu tenho um diretório (INPUTDIR) com nomes de amostra como subdiretórios (508_C, 540_C, 570_D etc). Dentro desses subdiretórios existe um outro diretório chamado FASTQ que contém dois tipos de arquivos. por exemplo, 540_Ct_1.fastq.gz    5...
02.12.2014 / 17:19
1
resposta

Excluir linhas nas quais 5 ou mais colunas têm valores menores que 3

Eu tenho um conjunto de dados de RNAseq de featureCounts que eu fundei. Eu tenho 3 condições com 3 réplicas. Eu quero excluir linhas onde 5 ou mais colunas têm valores menores que 3 de expressão gênica Aqui está uma amostra do meu conjunto de...
19.11.2018 / 05:05
0
respostas

Recuperar seletivamente porções de um arquivo grande se uma condição for atendida

Eu tenho um arquivo grande com muitas seções como esta: Bayes Empirical Bayes (BEB) analysis (Yang, Wong & Nielsen 2005. Mol. Biol. Evol. 22:1107-1118) Positively selected sites (*: P>95%; **: P>99%) (amino acids refer to 1s...
22.11.2018 / 00:07
1
resposta

como copiar colunas do arquivo 2 para o arquivo 1 quando algumas colunas correspondem a 2 arquivos

Eu tenho um arquivo head top_candidates 25 elevation_e gene1 20 9 0.0246022994932004 5 8 10.9217937824527 30 elevation_e gene1 59 18 0.0246022994932004 7 12 15.653559774527 31 elevation_e gene3 34 10 0.0246022994932004 6 9 9.47018...
16.10.2018 / 18:02
2
respostas

Redirecionando seds para arquivos individuais

Eu tenho um arquivo contendo uma lista de nomes de seqüência de DNA e outro contendo seqüências de DNA. Eles se parecem com isso: $ cat list.txt seq1 seq3 $ cat sequences.txt >seq1 AAAAA AAAAA >seq2 CCCCC CCCCC CCCCC >seq3 TTTTT...
08.06.2018 / 20:17