O arquivo não foi embaralhado. É apenas na codificação ISO-8859-6, e o Notepad ++ não pode lê-lo , mesmo que tenha escrito . O Notepad ++ pode funcionar apenas com algumas codificações; o grande menu para configuração de codificação é apenas para saída.
O Microsoft Word pode ler o arquivo, mas é necessário especificar a codificação como árabe (ISO) ao abri-lo. Isso significa ISO-8859-6, que é diferente da codificação do Windows em árabe, windows-1256.
Como alternativa, você pode editar o arquivo no Notepad ++ e adicionar as seguintes linhas no início:
<!doctype html>
<title>Test</title>
<meta charset=iso-8859-6>
Em seguida, salve-o com a extensão .html e abra-o em um navegador da web. Agora você deve ver o texto em árabe, que pode ser copiado e colado.
Como mais uma opção, baixe e instale o editor BabelPad . Seu comando Open permite que você selecione a codificação do arquivo sendo aberto, com ISO-8859-6 como uma das alternativas.
Observação: pode haver três caracteres estranhos no início do arquivo, ou seja, a marca de ordem de byte (BOM) como codificada em UTF-8, resultante da maneira como o arquivo foi gravado. Isso reflete as deficiências do Notepad ++.
Em geral, é melhor trabalhar com o UTF-8 durante todo o tempo, se possível. Isso desperdiça alguns bytes, mas evita problemas.