árabe / urdu texto scrambled

0

Eu criei um arquivo no notepad ++, converti sua codificação em Characterset- > Arabic- > ISO-8859-6

e copiou e colou algum texto em árabe e fechou o arquivo.

mas quando o reabrei, todo o texto foi convertido em alguns caracteres estranhos, algo como:

Ê? åèÇÕäÇÊ? æØÇå¬

Eu também abri o arquivo com o microsoft word e escolhi a codificação árabe (Windows), mas também não funcionou.

Eu realmente preciso desses dados de volta. Eu ficaria muito grato se alguém pudesse me dizer como obter o texto adequado de volta.

    
por Just_another_developer 18.12.2013 / 07:12

1 resposta

0

O arquivo não foi embaralhado. É apenas na codificação ISO-8859-6, e o Notepad ++ não pode lê-lo , mesmo que tenha escrito . O Notepad ++ pode funcionar apenas com algumas codificações; o grande menu para configuração de codificação é apenas para saída.

O Microsoft Word pode ler o arquivo, mas é necessário especificar a codificação como árabe (ISO) ao abri-lo. Isso significa ISO-8859-6, que é diferente da codificação do Windows em árabe, windows-1256.

Como alternativa, você pode editar o arquivo no Notepad ++ e adicionar as seguintes linhas no início:

<!doctype html>
<title>Test</title>
<meta charset=iso-8859-6>

Em seguida, salve-o com a extensão .html e abra-o em um navegador da web. Agora você deve ver o texto em árabe, que pode ser copiado e colado.

Como mais uma opção, baixe e instale o editor BabelPad . Seu comando Open permite que você selecione a codificação do arquivo sendo aberto, com ISO-8859-6 como uma das alternativas.

Observação: pode haver três caracteres estranhos no início do arquivo, ou seja, a marca de ordem de byte (BOM) como codificada em UTF-8, resultante da maneira como o arquivo foi gravado. Isso reflete as deficiências do Notepad ++.

Em geral, é melhor trabalhar com o UTF-8 durante todo o tempo, se possível. Isso desperdiça alguns bytes, mas evita problemas.

    
por 18.12.2013 / 08:02