Isso faz o básico, embora seja muito lento em uma grande lista de palavras: -
set Count
sort < WordList | uniq | while read w; \
do [ $(grep -c "^$w$" WordList) -ge $1 ] && echo $w; done
Uma resposta mais rápida (graças a Kamil Maciorowski): -
set Count
sort < WordList | uniq -c | while read c w; do [ $c -ge $1 ] && echo $w; done
Isso pressupõe: -
- Você definirá suas próprias entradas
FileList
eCount
. - As palavras são uma por linha em
WordList
. - O caso é significativo (por exemplo,
The
ethe
são diferentes). - Esta é a entrada da linha de comando: em um script,
set Count
seria omitido e passado como um parâmetro.
Isso deve começar, embora você quase certamente precise modificar suas necessidades específicas.