O gedit pode criar um arquivo Unicode?

4

Usando bless , posso ver que minha saída gedit é ASCII. gedit pode processar algum tipo de Unicode?

    
por H2ONaCl 09.05.2016 / 09:09

2 respostas

6

Quando você clica em salvar como, no canto inferior esquerdo você terá algumas codificações para escolher, escolha adicionar e remover (a última entrada) e você chegará a uma lista de codificações disponíveis, incluindo várias codificações unicode.

    
por Bruni 09.05.2016 / 09:43
6

Então, eu dei a Bruni uma screenshot para sua resposta para mostrar o que elas significavam. Mas então eu testei o resultado. Você pode, de fato, selecionar a codificação UTF-8 no gedit ou em qualquer outro editor de texto. No entanto, a menos que esses arquivos contenham caracteres não-ASCII **, eles serão detectados como ASCII. De fato, o mesmo vale se você criar um arquivo de "texto simples" (termo duvidoso *) por qualquer método, e esta resposta tem o motivo:

% bl0ck_qu0te%

Eu desafio qualquer um a testar essa resposta; Eu só posso criar um arquivo de texto "UTF-8" no meu sistema adicionando caracteres não-ASCII, mesmo que todos os meus terminais, todos os meus editores de texto e meu locale estejam configurados como UTF-8:

$ echo unicorns > rainbows; file rainbows
rainbows: ASCII text

redirecionando echo cria um arquivo que file diz ser ASCII (tente você mesmo!)

$ echo ユニコーン >> rainbows; file rainbows
rainbows: UTF-8 Unicode text

Anexar caracteres não-ASCII altera automaticamente a codificação? Não, apenas força file para ver que realmente, a codificação é UTF-8, porque ela não pode mais ser limitada a ASCII.

TL; DR

Não se preocupe, seus arquivos de texto "ASCII" são arquivos UTF-8 disfarçados (seu UTF-8 não pode ser detectado), e serão analisados como você deseja & amp; espere.

* Você estava interessado o suficiente para perguntar, então talvez você já entenda o que o redator deste artigo está contando nos. Esta parte explica mais sobre codificação e, especificamente, por que ASCII!=UTF-8 e por que você precisa para saber como você codificou seu texto. Eu extraí:

% bl0ck_qu0te%

** Fato divertido : @ByteCommander apontou para mim que file apenas analisa os primeiros 50-100kb do arquivo, portanto, se houver caracteres não-ASCII longe do início de um arquivo de texto, então file ainda achará que é ASCII.

    
por Zanna 11.07.2016 / 08:43