Como a codificação de caracteres dentro de Sakura é feita?

Question

Como a codificação de caracteres dentro de Sakura é feita?

#1 resposta do (0 votos)

1

No editor Sakura, você pode ter um arquivo .txt com codificação UTF-8, que contém 2 caracteres que não estão disponíveis no conjunto de caracteres EUC.

Quando salvei um .txt do UTF-8 para o EUC no editor, tudo funciona bem e todos os caracteres são exibidos corretamente.

Alguém sabe qual lógica o editor está usando para realizar isso?

c++ charset character-encoding

por jonsca 16.07.2010 / 11:43

1 resposta

Tags c++ charset character-encoding

Banda de Garagem e Controle de Acesso Correção da conexão com a Internet (pacotes ficam presos em algum lugar?)

score 0 · Answer 1

which contains 2 characters which are not available in EUC charset

Se você estiver vendo dois caracteres ÿþ (hex FF FE ) ou þÿ (hex FE FF ) no início da primeira linha , o arquivo será codificado em UTF -16, não UTF-8. Esses caracteres são, na verdade, a " marca de ordem de bytes " (BOM), que o editor deve interpretar, não mostra.

(Apenas no caso de você ver três caracteres ï»¿ , sendo hex EF BB BF , no começo da primeira linha, então essa é a BOM para UTF-8. Se você está vendo outros personagens, ou não no início da primeira linha, você pode editar sua pergunta para adicionar algum exemplo?)