Unix - Remove todos os caracteres minúsculos de uma string

0

Eu tenho sequências do código genético como esta: ACTGgcttaTGCA e estou tentando descobrir os comandos Unix para remover somente caracteres minúsculos, para que a string apareça como ACTGTGCA (gctta removido) .

Alguém pode oferecer algum conselho sobre os meios apropriados para fazer isso? Os arquivos são muito grandes para serem abertos em um editor de texto, portanto não posso simplesmente 'localizar e substituir'.

    
por Magpie101 04.11.2016 / 11:35

2 respostas

2

sed 's/[a-z]//g' yourfile >> newfile

Se você quiser editar o arquivo no local:

sed -i 's/[a-z]//g' yourfile
    
por 04.11.2016 / 11:42
0

Certamente você pode simplesmente localizar e substituir, basta fazer isso no fluxo, em vez de carregar o arquivo inteiro. Normalmente você usaria a ferramenta sed para isso. Isso pode se parecer com o seguinte:

sed -r 's/[a-z]*//g' input.txt

Isso corresponderia a qualquer sequência de caracteres minúsculos e os substituiria por nada.

    
por 04.11.2016 / 11:44

Tags