Perguntas sobre 'bioinformatics'

2
respostas

Distribuição Linux para bioinformática?

Eu preciso de uma distribuição linux projetada para bioinformática, incluindo alguma ferramenta de bioinformática, um banco de dados de amostra, etc.     
27.04.2012 / 23:10
3
respostas

como eu adiciono caracteres a linhas que não os têm

A primeira linha dos meus dados parece scaffold10x_1 AUGUSTUS gene 3591 3908 0.61 - . g1 scaffold10x_1 AUGUSTUS transcript 3591 3908 0.61 - . g1.t1 scaffold10x_1 AUGUSTUS stop_codon 3591 3593...
19.12.2017 / 11:27
1
resposta

Como imprimir linhas se dois campos tiverem valores idênticos?

Sou novo no unix, tenho uma dúvida sobre o subconjunto de dados, gostaria de receber ajuda de alguém. Eu tenho 23G arquivo de entrada contendo milhões de linhas, mas eu quero manter apenas as linhas onde a primeira e quarta coluna são idênticas...
15.02.2017 / 20:08
1
resposta

remove TAG / TAA / TGA

Eu tenho um arquivo no formato abaixo mencionado. Eu tenho que excluir os códons de parada (TAG / TAA / TGA) qualquer coisa que corresponda a TAG ou TAA ou TGA. a pesquisa deve ser em múltiplos de três. (como se ele tivesse que pesquisar a cada...
27.02.2017 / 17:49
2
respostas

Como combinar uma coluna de File1 para obter suas sequências fasta correspondentes no Arquivo 2?

Posso perguntar como combinar todos os valores da primeira coluna em Arquivo com o texto da linha no Arquivo 2 para que eu possa copiar as sequências fasta de todos os IDs do objeto no Arquivo 1? Arquivo 1.csv Object_ID, Length, Assignment...
11.10.2018 / 08:46
3
respostas

Como alterar arquivos com uma palavra específica para terminar in.fasta

Como eu seleciono e modifico arquivos que têm uma palavra específica para todos, em ".fasta"? Por exemplo, estou selecionando arquivos com a palavra "carro". find /home/user -name "*car*" que me dá /home/user/car.txt /home/user/scar...
03.11.2017 / 15:33
2
respostas

Usando Uniq -c com uma expressão regular ou contando o número de linhas removidas

Eu tenho um arquivo delimitado por tabulações com informações sobre material genético. Algumas informações são cortadas em um arquivo de guia menor com algumas das colunas extraídas e o uniq é usado para garantir que não haja duplicatas. Uma con...
02.08.2017 / 18:31
1
resposta

samtools / sed para edição do arquivo bam

Eu tenho o seguinte comando sed que altera o nome do cromossomo: for file in /myoldpath/*.bam; do filename=echo $file | cut -d "." -f 1 samtools view -H $file | sed -e 's/SN:([0-9XY])/SN:chr/' -e 's/SN:MT/SN:chrM/' | \ samtools reheader...
06.01.2017 / 11:12
1
resposta

Convertendo dados da coluna para matriz

Estou tentando criar uma matriz de características de plantas e espécies de plantas. Existem 2.912.746 linhas nos dados e 3 colunas. Existem diferentes números de características para cada espécie, e nem todas as espécies possuem todas as caract...
07.02.2016 / 19:51
1
resposta

Como faço para reinstalar os módulos bioperl no Ubuntu?

Estou tentando aprender bioinformática da maneira mais difícil. Eu não tenho experiência em Linux, Ubuntu, bash, Perl, Python, etc. Estou tentando usar vários programas, principalmente os módulos bioperl, que foram instalados e usados nesta máqu...
06.03.2013 / 14:54