Como posso editar o texto Unicode no Notepad ++?

25

Às vezes, edito o texto em inglês que inclui caracteres Unicode. Por alguma razão, no meu PC, o Notepad ++ converte caracteres Unicode em ???, corrompendo o texto e perdendo tudo isso dados. Eu estou procurando uma maneira de editar esse texto, preservando caracteres Unicode. Estou usando Consolas como minha fonte. Se a fonte não tiver todos esses caracteres, por que eu deveria perder os dados quando copiar o texto do Notepad ++ (por meio da área de transferência do Windows)?

    
por Robinicks 11.08.2009 / 15:11

6 respostas

14

Se o arquivo estiver realmente codificado em Unicode, o Notepad ++ deve detectá-lo automaticamente. A fonte Consolas funciona bem para mim. Você pode tentar uma destas duas opções de menu:

  • Codificação - > Codificar em UTF-8
  • Codificação - > Converter para UTF-8

Tenho certeza que o primeiro fará o que você quiser.

    
por 11.08.2009 / 15:30
14

O problema descrito na pergunta acontece quando um documento vazio / novo é definido como "ANSI" e Unicode os caracteres são colados nele.

Não há detecção automática quando usado com um documento vazio / novo, pelo menos não na versão do Notepad ++ que eu testei. "ANSI" é o padrão no Notepad ++ para um novo documento, a menos que seja definido no menu Configurações - > Preferências - > aba Novo Documento / Abrir Salvar Diretório .

Solução

A solução é definir a codificação para UTF-8 antes de colar, menu Formato - > Codificar em UTF-8 :

menu"comando"

Exemplo

Copiei algum texto para um novo documento do Notepad ++, russo (русский язык, russkiy yazyk) , do Firefox mostrando a página da Wikipedia Língua russa .

Se a codificação for não alterada de "ANSI", este é o resultado:

ResultadodacolagemdastringUnicode"Russian (русский язык, russkiy yazyk" em um novo documento do Notepad ++ sem alterar o codificação do padrão "ANSI".

Se a codificação for alterada, este é o resultado:

ResultadodacolagemdastringUnicode"Russa (русский язык, russkiy yazyk" em um novo documento do Notepad ++ depois de alterar o codificação do padrão "ANSI" para "UTF-8".

Como pode ser visto na figura abaixo (a parte Cyrillic é realçada), o Notepad ++ converte o Unicode caracteres em ASCII 63 (hex 3F), pontos de interrogação. É por isso que os caracteres Unicode são perdidos (no modo "ANSI" ) ao copiar o texto pela área de transferência (não é um problema de fonte - as informações são perdidas).

Testado em: Notepad ++ v5.4.5 (UNICODE).

    
por 17.09.2011 / 13:54
5

Há boas e más notícias.

Boas notícias: O Notepad ++ oferece suporte a Unicode (pelo menos do que posso reunir).

Notícia ruim: Aparentemente, o suporte a Unicode é apenas no Windows XP.

Na verdade, não tenho uma máquina Windows na minha frente. Pelo que me lembro, há um menu de codificação no menu Formatar em algum lugar. A codificação para Unicode é, na verdade, mais comumente em UTF-8.

Aqui está uma imagem "bonita" do suporte a Unicode no Notepad ++,

    
por 11.08.2009 / 15:30
3

O Unicode funciona perfeitamente no Windows 7. O único problema que surge é que você precisa digitar novamente os caracteres que foram alterados. Isso aconteceu comigo. Estou escrevendo com letras escandinavas, então - > E4, ö - > F6 É uma dor na bunda para substituir todos eles, mas vale a pena.

Se você codificar uma página de ANSI - > UTF-8, em seguida, haverá alguns problemas de caráter.

Sugiro que você crie uma nova página em UTF-8 e depois copie / cole suas informações. Não haverá / não deveria haver nenhum problema.

    
por 25.10.2009 / 14:39
1

Isso funciona para mim:

Mudei a fonte para Courier New no configurador de estilo no meu PC (Windows 7 com inglês / conjunto de caracteres US e romeno para conjunto não-Unicode). Está trabalhando com Courier New & Fontes Tahoma + codificação UTF-8.

    
por 14.04.2015 / 15:13
0

No menu superior, selecione Encoding e, em seguida, escolha Encode in UTF-8 ou Encode in UTF-8 Without BOM , para editar o texto na codificação Unicode.

    
por 19.09.2018 / 12:12