Veja a seguinte imagem:
Comovocêpodever,o"ä" na palavra "häufigkeit" é processado com um glifo Tamil . Isso acontece com quase todos os caracteres não-ASCII. Por exemplo, na barra de guias, após o título, deve haver reticências. Em vez disso, é processado com outro glifo Tamil.
Mas não é isso. Veja a seguinte imagem:
Napalavrarealçadacomcorlaranja,vejase"ä" está renderizado corretamente.
Eu não pareço observar nenhum padrão na aparência dos caracteres Tamil. Na maioria dos casos, parece que em um texto editável, os caracteres apropriados aparecem em um texto renderizado em HTML, aparecem caracteres em tâmil. Por exemplo, enquanto digito a pergunta, todos os caracteres não ASCII na pergunta que eu digitei aparecem corretamente, mas na visualização da pergunta, os caracteres Tamil aparecem novamente. Esta não é uma regra estrita, como na imagem acima, a palavra laranja não faz parte do bloco de texto editável e ainda é renderizada corretamente.
Além disso, isso parece ser um problema com aplicativos relacionados à Internet. O Emacs geralmente renderiza todos os caracteres perfeitamente. Mas quando eu abro este site em EWW , os caracteres tamil aparecem novamente no lugar dos caracteres não-ASCII.
Eu tentei remover fontes Tamil para ver o que acontece, mas não há melhorias. Esses caracteres ainda são renderizados. Eu não sei de onde (o renderizador) os obtém.
Saída de
fc-list | grep Tamil
, fc-list | grep tamil
, fc-list | grep indic
estão todos vazios.
Alguma idéia que possa explicar esse comportamento?
ATUALIZAÇÕES:
C-u C-x =
no caractere ä
em EWW fornece o seguinte resultado
(Eunãoconseguicopiarecolarasinformaçõesaquiporqueocaracteretâmilérenderizadocomocaracterelatinonormalaqui).
SeeucopiarcaracteresquenãosãorenderizadoscorretamentedoFirefoxoudoEWWparaoarquivodetextoEmacsnormal,elesserãorenderizadoscorretamente.Éassimquesobrevivi:)
EutenhoobservadoesseproblematambémemsitesHTTPS.Porexemplo, este site na Wikipedia não é processado corretamente.
Mais uma coisa interessante é que eu crio um arquivo new
com alguns caracteres não-ASCII. O Emacs renderiza o arquivo corretamente, mas o Firefox exibe os caracteres ä
. Saída de file new
:
new: UTF-8 Unicode text, with no line terminators