Método de entrada de idioma tcheco e suporte a fontes no gvim 7.4 no Windows 7

0

Gostaria de reabrir uma pergunta relacionada com o seguinte:

Suporte ao conjunto de caracteres (tcheco) em gvim 7.3 no Windows 7

Basicamente, nesse post eu notei que alguns personagens tchecos estavam sendo exibidos como quadrados pretos. Então eu postei a pergunta e notei que o problema parecia ter desaparecido mudando Fonte. Eu pensei que resolveu o problema porque os personagens no arquivo que eu estava usando exibido corretamente.

No entanto, notei o seguinte: enquanto alguns caracteres tchecos exibir corretamente, alterando a fonte do menu Gvim, outros não são exibidos corretamente:

Por exemplo, quando eu colo o caractere Ů (letra maiúscula latina u com anel acima) ou ů (letra minúscula latina u com anel acima), nenhuma fonte exibe o caractere resultante corretamente. Por exemplo, a fonte Fixedsys exibe um quadrado preto e um pequeno u, respectivamente, enquanto o Lucida Console exibe um U maiúsculo e um U pequeno, respectivamente. Eu tentei todas as fontes disponíveis no menu suspenso gvim, e nenhuma parece funcionar para este caso particular.

O problema não termina aqui. O método de entrada para caracteres unicode produz os caracteres errados:

O CTRL-V u0160 deve produzir o caractere tcheco (Š), mas o backquote (') é inserido no lugar. O CTRL-V u016e deve produzir o caractere tcheco (Ů), mas o caractere n (n) é inserido. E a lista continua.

Como se isso não fosse suficiente, há uma lista de combinações de teclas de método de entrada alternativas no seguinte site (que é uma lista de digraphs): link

mas apesar de ter a última versão do gvim, quando eu digito ": digraphs", esta lista não não aparece. Apenas a lista antiga do gvim 7.3 aparece, o que não inclui estes.

Por exemplo, CTRL-K U0 e CTRL-K u0 produzem o caractere zero em vez do seguinte:

Ů U0 016E 0366 LATIN CAPITAL LETTER U WITH RING ABOVE

ů u0 016F 0367 LATIN SMALL LETTER U WITH RING ABOVE

Para resumir, apesar de o gvim 7.4 ter sido lançado recentemente, nenhum dos as fontes são compatíveis com o idioma tcheco, inserindo unicode via CTRL-V parece produzir os caracteres errados e o suporte ao digrafo está incompleto.

Obrigado pelas suas respostas.

    
por John Sonderson 02.11.2013 / 17:46

1 resposta

1

O problema é que a codificação Latin-2 (iso-8859-2) e Windows-1250 (usada pelo windows) diferem em alguns caracteres:

ž, š, ť, Ž, Š, Ť

Todas as diferenças estão resumidas na na Wikipedia ou Versão tcheca

Se você definir encoding=cp1250 , tudo ficará bem.

Eu não quero prolongar os comentários, então estou adicionando isso aqui.

Existe um problema em que a página de códigos padrão utiliza apenas 1byte (hex 100) para caracteres, pelo que existem normas ISO para diferentes idiomas. Se você tiver set encoding iso-8859-2 e tentar adicionar o caractere unicode (hex 160) Š , o gvim fará um loop para o caractere (hex 60). Você tem que usar códigos ISO-8859-2, onde Š ìs (hexadecimais 089). Outros códigos aqui: link

O UTF-8, por outro lado, usa 2bytes e contém todos simultaneamente? letras e sinais. Portanto, se você usar set encoding=utf-8 e, em seguida, adicionar U0160 ou U5927 , obterá Š resp. %código%.

contém ů e Ů, OU há uma diferença nas versões de fonte entre as mutações de idioma do Windows (eu uso a versão tcheca), mas duvido disso. Você pode usar o utilitário Windows Fixedsys , lá você pode selecionar a fonte desejada e verificar quais caracteres ela suporta, até mesmo o seu código unicode.

Eu estava tentando algumas fontes padrão no GVim e parece haver algumas que suportam chinês (ie Charmap.exe ), mas não sei quais sinais são importantes.

O GVim parece estar suportando apenas MS Mincho fontes de caracteres, então, se você estiver procurando por outra fonte, esteja ciente disso. :)

    
por 02.11.2013 / 17:53