Carregando um arquivo de codificação chinês no vim, erros de conversão

0

Eu posso ver o link e salvá-lo em um arquivo. No Chrome, posso ver a origem e ver o título da página como 波羅蜜. Se eu abrir o arquivo salvo no vim para editar, vejo pontos de interrogação para esses caracteres. Então, se eu :set encoding=gb2312 , eu verei os dois primeiros caracteres e depois os pontos de interrogação. Se, em vez disso, eu fizer :e ++enc=gb2312 %:p , verei o caractere do meio.

Depois que o arquivo é aberto (porque eu uso o MacVim e o Fetch abre o arquivo para mim automaticamente), qual é o fluxo de trabalho correto para editar este arquivo?

    
por William Entriken 31.08.2010 / 16:12

2 respostas

0

O gb2312 apenas faz caracteres simplificados.

Firefox, Mozilla e python2-chardet-2.0.1 estão todos dizendo que isso é gb2312, mas como ele tem caracteres tradicionais, o charset necessário é gb18030.

Então: se parece um pato, grita como um pato, cheira a pato, e tem gosto de pato ... abra o arquivo com o hexdump e leia o arquivo de definição da página de código.

    
por 31.08.2010 / 17:19
0

Eu tenho o vim configurado para usar o UTF-8, já que até onde posso ver os caracteres corretamente. Talvez tente

set encoding=utf-8
    
por 31.08.2010 / 17:46