sed 's/[a-z]//g' yourfile >> newfile
Se você quiser editar o arquivo no local:
sed -i 's/[a-z]//g' yourfile
Eu tenho sequências do código genético como esta: ACTGgcttaTGCA
e estou tentando descobrir os comandos Unix para remover somente caracteres minúsculos, para que a string apareça como ACTGTGCA
(gctta removido) .
Alguém pode oferecer algum conselho sobre os meios apropriados para fazer isso? Os arquivos são muito grandes para serem abertos em um editor de texto, portanto não posso simplesmente 'localizar e substituir'.
sed 's/[a-z]//g' yourfile >> newfile
Se você quiser editar o arquivo no local:
sed -i 's/[a-z]//g' yourfile
Certamente você pode simplesmente localizar e substituir, basta fazer isso no fluxo, em vez de carregar o arquivo inteiro. Normalmente você usaria a ferramenta sed
para isso. Isso pode se parecer com o seguinte:
sed -r 's/[a-z]*//g' input.txt
Isso corresponderia a qualquer sequência de caracteres minúsculos e os substituiria por nada.
Tags unix