Eu tenho vários arquivos de texto como este:
>nexus0013_Pseudomonas_59M
NNNNNNNNNNNNNNNNNNNNNNNNNNNTTGCTAGGTGCCCTGCGCTTCCCTGTGGCTGCCGCCTGGGCCGCCGAGCTCCGCCAGGAACTGCCGGGGGGCACGCAGACCTGGAGCAGCGAAGAACTGCTCAGGCATCCGCAGGCCCGCGACCTGGACATCCCGGCCGA...
Seguindo minha pergunta anterior , como posso manter as linhas com somente uma não -N genótipo?
A N N A N N A N N N N
N N N C N N N N N N N
N N N N N N G N N N N
N N N T N N N N N N N
G N N N G N N N N N N
C N N C N C N N N N N
minha s...
Eu tenho muitos arquivos que contêm strings similares como:
>33100_Pseudomonas_etcetera1
texttexttext
>33632_Pseudomonas_etcetera2
texttexttext
>36406_Pseudomonas_etcetera3
texttexttext
e eu preciso de resultados como este:
&g...
Eu tenho um arquivo grande, file1, contendo muitas informações, por exemplo
rs969931 C A 1.993 1.189 1.003 ..............
rs2745406 C T 1.993 1.166 1.003 ..............
rs6939431 A G 0.003 0.207 0.005 .............
Eu tenho uma tabela SNP parecida com esta
A N N N N N N N N N N N
N C N N N C N N N N N N
N N N N N N N N N N N N
N C N N N C N N N N N N
N N N N N N N N N N N N
C C N N N N N N N N N N
C C N N N C C N N N N N
N N N N N N N N N N N N
Eu q...
Eu preciso executar um programa usando 2 arquivos como entrada, esperando uma saída com 6000 arquivos, variando de abc0000.faa / abc0000.fna a abc6000.faa / abc6000.fna. Eu também preciso que o arquivo de saída tenha o mesmo nome de arquivo que...
Eu tenho o arquivo de seqüência Illumina formatado pelo FASTQ assim:
@ERR009148.2485 IL26_1382:7:1:224:616 length=36
ATCACATGCTCCTTGTTCTGCAGCTTGGTGCGGATG
+ERR009148.2485 IL26_1382:7:1:224:616 length=36
>>>>>>>>>>...
Estou tentando instalar o software Proteios no Ubuntu 16. Um dos requisitos para este software é
(*) Acesso de gravação a $ SERVICE_PATH (padrão /etc/init.d)
Como posso conseguir isso?
Eu quero extrair o bloco de texto baseado em ids presentes em outro arquivo,
Entrada
>Feature scaffold1
1 100 g
101 200 g
201 300 g
500 500 r
900 1000 r
>Feature scaffold2
1 100 g
01 500 g
200 300 r
>Feature scaffold3
10...
Eu quero extrair todas as linhas em um arquivo contendo esses padrões: "# 1:" e "comprimento da árvore para".
Entrada:
#1: nexus0002_Pseudomonas_10M
branch t N S dN/dS dN dS N*dN S*dS
6..5...