Windows 7 e UTF-8 salvando e exibindo em programas

3

Acabei de adquirir um novo sistema, o Windows 7 Home Premium, instalei o Notepad ++ e usei-o por alguns dias. Eu escrevi alguns arquivos html / php em chinês, salvos como UTF-8 sem BOM. Enviado para servidor e testado, tudo está bem, até agora.

De alguma forma, o Notepad ++ não exibe mais os caracteres chineses no editor e tudo o que ele mostra são quadrados. Brincar com as conversões de codificação, etc., não ajuda. Até agora, parecia um bug do Notepad ++.

Então baixei e instalei o Komodo edit. A mesma coisa aconteceu. Copiar e colar texto em chinês de um site chinês como o sohu.com no editor também mostrará praças.

Então eu tento notepad.exe, mesmo problema. Mas funciona no Microsoft Word e Wordpad.

A única grande coisa que fiz antes desta questão surgir é instalar o SQL Management Studio 2008 x86. Isso teria algum efeito no sistema? Talvez tenha mudado a localidade do banco de dados e tudo mais?

Alguém tem alguma idéia de como corrigir isso? Eu me lembro em versões mais antigas do Windows, há uma opção nas configurações de idioma regional para "estender as configurações de idioma para outros programas" algo assim. Mas não consigo mais encontrá-lo no Windows 7.

EDIT: Eu encontrei o link que diz para criar um novo perfil. Eu não tentei. Mas ir por esse caminho é ridículo ...

    
por Jake 27.11.2011 / 13:13

2 respostas

1

Defina a localidade do sistema para chinês (PRC) > reinicie o computador > voltar ao local desejado > reiniciar o computador deve redefinir as configurações de unicode para aplicativos. algum local diferente do chinês (PRC) pode funcionar também.

Isso me permite digitar e exibir texto em chinês no bloco de notas, mas os arquivos existentes em BOM UTF-8 (com ou sem) parecem estar permanentemente corrompidos ... qualquer um sabe como revivê-los? Não há maneira de reviver eu acho. = (

0000-0520:  76 3e 0a 09-09 09 3c 64-69 76 20 69-64 3d 22 63  v>....<d iv.id="c
0000-0530:  6f 6c 2d 74-77 6f 22 3e-0a 09 09 09-09 3c 64 69  ol-two"> .....<di
0000-0540:  76 20 63 6c-61 73 73 3d-22 73 65 63-74 69 6f 6e  v.class= "section
0000-0550:  22 3e 0a 09-09 09 09 09-3c 70 3e 3f-3f 3f 3f 3f  ">...... <p>?????
0000-0560:  3f 3f 3f 3f-3f 3f 3f 3f-3f 3f 3f 3f-3f 3f 3f 3f  ???????? ????????
0000-0570:  3f 32 30 30-33 3f 3f 3f-3f 3f 3f 3f-3f 3f 3f 3f  ?2003??? ????????
0000-0580:  3f 3f 3f 3f-3f 3f 3f 3f-3f 3f 3f 3f-3f 3f 3f 3f  ???????? ????????
0000-0590:  3f 3f 3f 3f-3f 3f 3f 3f-3f 3f 3f 3f-3f 3f 3f 3f  ???????? ????????
0000-05a0:  3f 3f 3f 3f-3f 3f 3f 3f-3f 3f 3f 3f-3f 3f 3f 3f  ???????? ????????
0000-05b0:  3f 3f 3f 3f-3f 3f 3f 3f-3f 3f 3f 3f-3f 3f 3f 3f  ???????? ????????
0000-05c0:  3f 3f 3f 3f-3f 3f 3f 3c-2f 70 3e 0a-09 09 09 09  ???????< /p>.....
0000-05d0:  09 3c 74 61-62 6c 65 20-63 6c 61 73-73 3d 22 63  .<table. class="c
0000-05e0:  6f 6e 74 61-63 74 22 3e-0a 09 09 09-09 09 3c 74  ontact"> ......<t
0000-05f0:  72 3e 3c 74-68 20 63 6f-6c 73 70 61-6e 3d 22 32  r><th.co lspan="2
0000-0600:  22 3e 3f 3f-3f 3f 3c 2f-74 68 3e 3c-2f 74 72 3e  ">????</ th></tr>
0000-0610:  0a 09 09 09-09 09 3c 74-72 3e 3c 74-64 20 63 6f  ......<t r><td.co
    
por 27.11.2011 / 15:25
1

saved as UTF-8 without BOM

Os aplicativos do Windows normalmente dependem do BOM para identificar a codificação de um arquivo Unicode.

A maioria dos aplicativos permite que você especifique uma codificação na caixa de diálogo "Arquivo, abrir". Se você usa isso, não deve ter problema.

    
por 27.11.2011 / 14:19