O que você está vendo é chamado de mojibake . Em suma, o aplicativo com o qual você está abrindo o arquivo está usando a codificação incorreta para tentar ler o arquivo. A solução padrão é usar uma ferramenta de transcodificação, on-line ou off-line (embora não conheça outras gratuitas para o Windows que funcionem off-line) ou abra o documento em um aplicativo que permite definir a codificação e salvá-la como desejado codificação.
Como alternativa um pouco hacky, se você pode salvar o arquivo sem modificar a codificação, você pode alterar a extensão para .eml
, formate como uma mensagem de email , certifique-se de que o cabeçalho Content-Type
especifique a codificação correta e abra o arquivo resultante em um bom cliente de email (praticamente qualquer coisa, exceto Outlook ou Windows Mail) e copie o texto de lá para um editor de texto e salve-o.
Para referência futura, o método geralmente aceito para evitar isso é salvar arquivos como UTF-8 ou UTF-16 (UTF-8 é geralmente preferido, pois é melhor suportado pela maioria das plataformas diferentes do Windows que UTF-16) .
Em particular, seu arquivo parece ser codificado usando o KOI-8 (determinado com base na afirmação de que o texto é cirílico e a distribuição aparente de caracteres reais), com o aplicativo aparentemente interpretando-o como ISO-8859-1 ou a página de códigos do Windows 1252 (determinada simplesmente com base no que está sendo exibido, mais o fato de que essas são codificações de fallback padrão para muitos dispositivos).