arquivos TXT: como mudar de caracteres estranhos de volta ao normal?

0

Então, eu tenho em uma unidade flash um arquivo txt gerado em cirílico (meu próprio trabalho, pen drive), alguns anos de idade. Agora eu precisava abri-lo, só para ver esse tipo de bagunça .

Eu me pergunto por que isso está acontecendo e como posso restaurá-lo ao normal? Eu tentei salvá-lo em codificação Unicode e UTF-8, até mesmo algum formato MS-DOS (uma opção do Wordpad), mas não faz diferença em tudo.

    
por Alex 17.09.2018 / 15:24

2 respostas

1

O que você está vendo é chamado de mojibake . Em suma, o aplicativo com o qual você está abrindo o arquivo está usando a codificação incorreta para tentar ler o arquivo. A solução padrão é usar uma ferramenta de transcodificação, on-line ou off-line (embora não conheça outras gratuitas para o Windows que funcionem off-line) ou abra o documento em um aplicativo que permite definir a codificação e salvá-la como desejado codificação.

Como alternativa um pouco hacky, se você pode salvar o arquivo sem modificar a codificação, você pode alterar a extensão para .eml , formate como uma mensagem de email , certifique-se de que o cabeçalho Content-Type especifique a codificação correta e abra o arquivo resultante em um bom cliente de email (praticamente qualquer coisa, exceto Outlook ou Windows Mail) e copie o texto de lá para um editor de texto e salve-o.

Para referência futura, o método geralmente aceito para evitar isso é salvar arquivos como UTF-8 ou UTF-16 (UTF-8 é geralmente preferido, pois é melhor suportado pela maioria das plataformas diferentes do Windows que UTF-16) .

Em particular, seu arquivo parece ser codificado usando o KOI-8 (determinado com base na afirmação de que o texto é cirílico e a distribuição aparente de caracteres reais), com o aplicativo aparentemente interpretando-o como ISO-8859-1 ou a página de códigos do Windows 1252 (determinada simplesmente com base no que está sendo exibido, mais o fato de que essas são codificações de fallback padrão para muitos dispositivos).

    
por 17.09.2018 / 21:15
0

Você pode tentar o editor CudaText (ou SynWrite), grátis.

  • abra este arquivo txt
  • clique no campo da barra de status com o nome da codificação (por exemplo, ANSI), "Recarregar como"
  • encontre a codificação que faz o texto OK
  • ao encontrar a codificação, clique no campo da barra de status com o nome da codificação, "Converter em"
  • use UTF8
  • salva o arquivo com UTF8
por 18.09.2018 / 07:12