Obtendo uma lista de palavras de um dicionário do aspell do GNU [duplicado]

2

Eu baixei o pacote aspell para o suporte ao dicionário da língua bengali. A partir do tarball, consegui isolar o arquivo bn.wl, que é simplesmente uma lista de cerca de 100.000 palavras, uma em cada linha.

O problema é que a codificação é aparentemente is13194-bn, e qualquer editor de texto que eu abrir o arquivo está mostrando lixo (uma palavra-lixo por linha). Provavelmente está esperando o utf8 ou algo assim.

Como posso converter este arquivo para um formato legível? Eu tentei usar o iconv, mas aparentemente ele não reconhece a codificação.

    
por Velvet Ghost 13.04.2012 / 08:08

1 resposta

1

Use o próprio aspell para fornecer a lista de palavras em um formato legível:

aspell -l bn dump master

O switch -l tem como alvo um dicionário específico, se estiver ausente, então o dicionário padrão é escolhido.

    
por 13.04.2012 / 13:54