Caracteres especiais na entrada do hunspell são tratados como espaço

1

Estou testando o hunspell na linha de comando com um dicionário sueco. A entrada no modo interativo substitui todos os caracteres especiais (por exemplo, å ä ö) por espaços em branco antes de chechar a ortografia.

Hunspell 1.3.2
sjögräs
& sj 15 0: SJ, aj, dj, sk, s, j, sej, sju, sjö, sjå, sa, se, ej, st, si
& gr 15 3: ge, g, r, ger, gir, gro, gör, grå, går, gry, er, nr, dr, go, kr
*

sj gr s
& sj 15 0: SJ, aj, dj, sk, s, j, sej, sju, sjö, sjå, sa, se, ej, st, si
& gr 15 3: ge, g, r, ger, gir, gro, gör, grå, går, gry, er, nr, dr, go, kr
*

Como você pode ver, a codificação do prompt está funcionando, mostrando å ä e ö tanto na entrada quanto na saída.

A tubulação fornece o mesmo resultado:

echo sjögräs | hunspell -d sv_SE

Eu tentei dar opções diferentes ao hunspell, incluindo -i UTF-8 , -i UTF-16 e mantendo o SET ISO8859-1 do arquivo aff. Nada funcionou.

A mesma coisa acontece com o francês:

C:\Users\gauthier>echo résultat | hunspell -d fr-moderne
Hunspell 1.3.2
*
& sultat 2 2: sultan, rAcsultat

com problemas adicionais com a saída.

Eu compilei o hunspell no MinGW e movi os arquivos necessários resultantes para algum lugar no meu caminho, mas não acho que essa informação seja muito relevante.

Como faço para o hunspell reconhecer caracteres especiais em sua entrada?

    
por Gauthier 12.03.2012 / 16:20

0 respostas