POSIXly:
tr -s '[:blank:]' '[\n*]' <file | grep '^[[:lower:]]*$'
Estou tentando obter uma lista de todas as palavras em minúsculas em um arquivo. Até agora eu cheguei ao ponto de conseguir uma lista com a linha de comando
cat filename.txt | tr ' ' \n | grep -w '[[:lower:]]*' | sort -u | less
No entanto, este comando não elimina os caracteres não alfabéticos da lista; Eu recebo uma lista com o formulário
(which
(which,
about
about,
about.
about:
about;
about?
which
Estou interessado apenas nas linhas com apenas as palavras. Como posso obtê-los com um comando de linha similar?
Aqui você está:
sed 's/[^A-Za-z]\+/\n/g;s/$/\n/;s/[^\n]*[A-Z][^\n]*\n//g;s/\n$//' <input_file | sort -u
Depois de um tempo eu voltei a esta questão, e só quero mostrar o meu comando fixo que fez o truque, para o registro.
tr -s '[:blank:]' '[\n*]' < filename.txt | grep -wo '[[:lower:]]*' | sort -u | less -N