Basicamente, isso pode ser um problema de incompatibilidade entre sua localidade, definida como UTF-8
, e a codificação de seu arquivo de caracteres Chineses, que pode ser codificado em gbk
, gb2312
, gb18030
, ou Big-5
.
Todas as codificações listadas acima são incompatíveis com UTF-8
.
Agora, vamos supor que gbk
seja a codificação do seu arquivo. Portanto, quando você tenta mostrar o conteúdo do arquivo, um arquivo gbk
codificado é interpretado como um arquivo UTF-8
, o que causa o jargão.
Aí vem a solução.
-
Use
luit
. (Preferido)$ whatis luit luit (1) - Locale and ISO 2022 support for Unicode terminals
luit -encoding gbk cat a_chinese_file.txt
Como a maioria das codificações (se não todas) em uso é compatível com ASCII
, e se você precisar apenas de caracteres em ASCII
e outra codificação, poderá usar os dois métodos a seguir.
-
Altere a codificação do seu terminal
Você pode considerá-lo, já que esse método não exige que um pacote adicional seja instalado.
-
Alterar sua localidade
Mas acho que isso exige que você instale o local correspondente.
Alguns detalhes sobre a codificação chinesa mencionada acima.
-
gbk
,gb2312
,gb18030
são codificações para chinês simplificado.Se você não tiver certeza sobre qual codificação está usando, suponha que
gb18030
.O número de caracteres contidos em cada codificação segue o seguinte:
gb18030
>gbk
> %código%. E a codificação superior é um superconjunto do que segue. -
gb2312
é a codificação para chinês tradicional.
Além disso, a codificação para chinês simplificado é às vezes referida como Big-5
(Página de código 936, acho que esse nome vem do Windows).