Renderização incorreta de caracteres em aplicativos relacionados à Internet

1

Veja a seguinte imagem:

Comovocêpodever,o"ä" na palavra "häufigkeit" é processado com um glifo Tamil . Isso acontece com quase todos os caracteres não-ASCII. Por exemplo, na barra de guias, após o título, deve haver reticências. Em vez disso, é processado com outro glifo Tamil.

Mas não é isso. Veja a seguinte imagem:

Napalavrarealçadacomcorlaranja,vejase"ä" está renderizado corretamente.

Eu não pareço observar nenhum padrão na aparência dos caracteres Tamil. Na maioria dos casos, parece que em um texto editável, os caracteres apropriados aparecem em um texto renderizado em HTML, aparecem caracteres em tâmil. Por exemplo, enquanto digito a pergunta, todos os caracteres não ASCII na pergunta que eu digitei aparecem corretamente, mas na visualização da pergunta, os caracteres Tamil aparecem novamente. Esta não é uma regra estrita, como na imagem acima, a palavra laranja não faz parte do bloco de texto editável e ainda é renderizada corretamente.

Além disso, isso parece ser um problema com aplicativos relacionados à Internet. O Emacs geralmente renderiza todos os caracteres perfeitamente. Mas quando eu abro este site em EWW , os caracteres tamil aparecem novamente no lugar dos caracteres não-ASCII.

Eu tentei remover fontes Tamil para ver o que acontece, mas não há melhorias. Esses caracteres ainda são renderizados. Eu não sei de onde (o renderizador) os obtém.

Saída de fc-list | grep Tamil , fc-list | grep tamil , fc-list | grep indic estão todos vazios.

Alguma idéia que possa explicar esse comportamento?

ATUALIZAÇÕES:

C-u C-x = no caractere ä em EWW fornece o seguinte resultado

(Eunãoconseguicopiarecolarasinformaçõesaquiporqueocaracteretâmilérenderizadocomocaracterelatinonormalaqui).

SeeucopiarcaracteresquenãosãorenderizadoscorretamentedoFirefoxoudoEWWparaoarquivodetextoEmacsnormal,elesserãorenderizadoscorretamente.Éassimquesobrevivi:)

EutenhoobservadoesseproblematambémemsitesHTTPS.Porexemplo, este site na Wikipedia não é processado corretamente.

Mais uma coisa interessante é que eu crio um arquivo new com alguns caracteres não-ASCII. O Emacs renderiza o arquivo corretamente, mas o Firefox exibe os caracteres ä . Saída de file new :

new: UTF-8 Unicode text, with no line terminators
    
por nitishch 30.08.2015 / 07:11

1 resposta

1

Como aponta @Gilles nos comentários, é um problema de fonte. Eu tentei C-u C-x = no caractere renderizado incorretamente e no caractere ä que é renderizado corretamente.

A única diferença foi nesta linha:

Para o caractere renderizado corretamente:

xft:-paratype-PT Mono-normal-normal-normal-*-17-*-*-*-m-0-iso10646-1 (#xA5)

Para caracteres gerados incorretamente:

Veja a última linha da terceira imagem na pergunta.

Como se pode ver, por algum motivo, o Emacs e o Firefox usam a fonte TSCU_Paranar, que por acaso é uma fonte Tamil. Eu removi essa fonte e alterei a fonte padrão em ambas para uma que suporta todos os caracteres latinos.

Isso resolveu o problema

    
por 31.08.2015 / 10:00