Gostaria de saber como pesquisar e substituir o caractere unicode xE5
"por æ
Observe que æ
é realmente Unicode 00E6
não 00E5
.
Pesquisar e substituir não é o jeito certo de exibir os caracteres corretos.
<?xml version="1.0" encoding="utf-8"?>
Os estados acima indicam que a codificação é utf-8
, mas o arquivo está realmente codificado como ANSI
.
Você precisa converter o arquivo corretamente em UTF-8
, da seguinte maneira:
-
Abra o Testfile.xlf
-
O arquivo se parece com:
Unicode é exibido incorretamente.
-
Menu > Codificação > Selecione Codificar em ANSI
-
O arquivo se parece com:
Unicode é exibido corretamente.
-
Selecione todo o conteúdo do arquivo ( ctrl + a )
-
Menu > Codificação > Selecione Converter para UTF-8
-
Salve o arquivo ( ctrl + s )
-
Feche e reabra.
-
O arquivo agora está codificado corretamente como os caracteres UTF-8 e Unicode são exibidos corretamente.
Como você pode ver que o arquivo é realmente ANSI?
O utilitário cygwin file
mostra isso (antes e depois da conversão):
DavidPostill@Hal /f/test
$ file -i Testfile*.xlf
Testfile.xlf: application/xml; charset=iso-8859-1
TestfileConverted.xlf: application/xml; charset=utf-8