obtendo uma lista de todas as palavras minúsculas em um arquivo

0

Estou tentando obter uma lista de todas as palavras em minúsculas em um arquivo. Até agora eu cheguei ao ponto de conseguir uma lista com a linha de comando

cat filename.txt | tr ' ' \n | grep -w '[[:lower:]]*' | sort -u | less

No entanto, este comando não elimina os caracteres não alfabéticos da lista; Eu recebo uma lista com o formulário

(which
(which,
about
about,
about.
about:
about;
about?
which

Estou interessado apenas nas linhas com apenas as palavras. Como posso obtê-los com um comando de linha similar?

    
por erreka 27.01.2016 / 03:22

3 respostas

2

POSIXly:

tr -s '[:blank:]' '[\n*]' <file | grep '^[[:lower:]]*$'
    
por 27.01.2016 / 03:30
1

Aqui você está:

sed 's/[^A-Za-z]\+/\n/g;s/$/\n/;s/[^\n]*[A-Z][^\n]*\n//g;s/\n$//' <input_file | sort -u
    
por 27.01.2016 / 03:25
0

Depois de um tempo eu voltei a esta questão, e só quero mostrar o meu comando fixo que fez o truque, para o registro.

tr -s '[:blank:]' '[\n*]' < filename.txt | grep -wo '[[:lower:]]*' | sort -u | less -N
    
por 19.07.2016 / 22:05

Tags