Como a codificação de caracteres dentro de Sakura é feita?

1

No editor Sakura, você pode ter um arquivo .txt com codificação UTF-8, que contém 2 caracteres que não estão disponíveis no conjunto de caracteres EUC.

Quando salvei um .txt do UTF-8 para o EUC no editor, tudo funciona bem e todos os caracteres são exibidos corretamente.

Alguém sabe qual lógica o editor está usando para realizar isso?

    
por jonsca 16.07.2010 / 13:43

1 resposta

0

which contains 2 characters which are not available in EUC charset

Se você estiver vendo dois caracteres ÿþ (hex FF FE ) ou þÿ (hex FE FF ) no início da primeira linha , o arquivo será codificado em UTF -16, não UTF-8. Esses caracteres são, na verdade, a " marca de ordem de bytes " (BOM), que o editor deve interpretar, não mostra.

(Apenas no caso de você ver três caracteres  , sendo hex EF BB BF , no começo da primeira linha, então essa é a BOM para UTF-8. Se você está vendo outros personagens, ou não no início da primeira linha, você pode editar sua pergunta para adicionar algum exemplo?)

    
por 17.07.2010 / 16:49