O programa recode
pode fazer isso rapidamente, mesmo para arquivos grandes, seja para estatísticas de frequência para bytes ou para caracteres de vários conjuntos de caracteres. Por exemplo. para contar as frequências de bytes:
$ echo hello there > /tmp/q
$ recode latin1/..count-characters < /tmp/q
1 000A LF 1 0020 SP 3 0065 e 2 0068 h 2 006C l 1 006F o
1 0072 r 1 0074 t
Cuidado - especifica seu arquivo para ser recodificado como entrada padrão, caso contrário, ele silenciosamente o substituirá pelas freqüências de caracteres!
Use recode utf-8/..count-characters < file
para tratar o arquivo de entrada como utf-8. Muitos outros conjuntos de caracteres estão disponíveis e falhará se o arquivo contiver caracteres ilegais.