Caracteres Unicode sendo substituídos por pontos de interrogação após copiar e colar no Windows

3

Eu tenho esse problema estranho que eu tenho tendo há anos desde o Windows 8 (agora estou no Windows 10, se bem me lembro. O problema parece estar no meu computador de trabalho. Meus outros computadores pessoais não não parece ter um problema. Eu não pensei em pedir ajuda no início porque eu encontrei uma solução - o que eu explicarei mais tarde - mas eu acho que é o suficiente.

Basicamente, sempre que copio e colo texto Unicode (japonês, árabe, etc.), eles aparecem como pontos de interrogação na pasta. Aqui está um exemplo de texto em japonês que eu copio:

何これ?!意味わかない!

E aqui está o que parece depois de colar:

????!??????!

Curiosamente, se eu copiar o mesmo texto novamente por pelo menos mais uma vez, ele será colado corretamente ...

何これ?!意味わかない!

Remover até mesmo um único caractere da seleção antes da cópia fará com que o problema seja "redefinido".

Esta foi a minha solução. Não é muito difícil de fazer, mas eu sempre esqueço de fazer isso porque meus outros PCs funcionam bem. Isso adiciona mais etapas e desperdiça segundos preciosos.

O problema é todo o sistema e afeta todos os programas e aplicativos que eu uso.

Alguma ideia de como consertar isso permanentemente? Qualquer ajuda será muito apreciada.

    
por DeVilFisCh 12.01.2017 / 11:53

2 respostas

1

Eu "sofri" dessa questão por anos e nunca soube que a correção era tão simples e simples até Sanny menunctar "locale" em um comentário acima (Obrigado Sanny!). Haha! De qualquer forma, aqui está como consertá-lo se você encontrar o mesmo problema que eu:

Isso se aplica ao Windows 10 (compilação 15002), mas pode ser semelhante às versões mais antigas (ou mais recentes) do Windows.

  1. Vá para as configurações da região no painel de controle. Existem várias maneiras de fazer isso e aqui estão algumas delas.
    • Na barra de pesquisa (Cortana) na barra de tarefas, procure por "Painel de controle". No Painel de controle, clique em Alterar formatos de data, hora ou número em Relógio, idioma e região na exibição de categoria ou Região na lista de ícones ver
    • Somente no Windows 10: na barra de pesquisa, pesquise por "região e configurações de idioma". Isso abrirá a Região & Página de idioma no aplicativo Configurações. Desloque-se até encontrar Data, hora e & adicional configurações de região . Você pode então selecionar Região na janela do Painel de Controle que se abre.
  2. Abra a guia Administrativo e clique no botão Alterar localidade do sistema . Escolha uma localidade diferente da sua localidade atual. Eu fui com o japonês. Acho que escolher o idioma que você copiará e colar com frequência seria melhor, embora possa ser o mesmo, independentemente disso. Reconheça a mudança com OK.
  3. O sistema pedirá que você reinicie o que você obviamente precisará fazer para notar as alterações.
  4. Depois de reiniciar, teste se copiar e colar agora funciona como pretendido. Após o sucesso, você pode refazer as etapas acima novamente e voltar para a localidade que realmente precisa usar.

É isso! Desfrute de copiar e colar! ;)

    
por 15.01.2017 / 08:37
1

Os produtos da Microsoft são todos compatíveis com Unicode. Não faz sentido ter que alterar sua localidade para corrigir o problema.

O ????? indica que Unicode ou UTF-8 não está sendo reconhecido corretamente (em vez de ser diagnosticado incorretamente como um conjunto de caracteres diferente (talvez entre o programa e a área de transferência).

Mas parece que este é um bug real - parece que o SO achou o ASCII pela primeira vez, mas depois tentou novamente com o UTF-8. O mundo Unicode é muito complexo - para armazenar Unicode completo em todos os conjuntos de caracteres possíveis, você precisaria dobrar o espaço e converter todas as suas funções para serem compatíveis com UTF-16 - um empreendimento enorme e pouco prático - imagine o armazenamento e o processamento necessários para converter para UTF-16/32 - estamos falando de todos os documentos que você possui ou visualiza ... então praticamente usamos UTF-8 que codifica o padrão UTF para 8 bits. Mas funções legadas e documentos baseados em ASCII precisam ser convertidos para UTF-ASCII, etc. O que estava acontecendo aqui é que o sistema operacional "adivinhou" incorretamente que a codificação era ASCII e usava uma função / classe separada para copiar e colar ( ou a função / classe padrão). Uma vez que "percebeu" a codificação era Unicode, usou essa codificação. Embora o Unicode UTF-8 seja o padrão, há em média 3-4 codificações diferentes por idioma para um sistema operacional lidar, e sem saber de antemão qual é a codificação - ter que determinar isso é bem difícil.

Do ponto de vista de um computador, seu personagem parece um conjunto pré-determinado de 1s e 0s e não há como saber objetivamente qual é a conversão correta em que 01000001 é um 'A', por exemplo. Também poderia ser um א em hebraico ou algum outro caractere. O Unicode mudou tudo isso - cada caractere tem uma atribuição exclusiva de 8 bits, o que significa que você pode determinar o que é baseado no intervalo de codificação.

Portanto, o copiar e colar mal-comportado provavelmente tem a ver com a funcionalidade legada com atualização ASCII e deve resolver o problema!

    
por 02.10.2018 / 09:49