Quando você clica em salvar como, no canto inferior esquerdo você terá algumas codificações para escolher, escolha adicionar e remover (a última entrada) e você chegará a uma lista de codificações disponíveis, incluindo várias codificações unicode.
Usando bless
, posso ver que minha saída gedit
é ASCII. gedit
pode processar algum tipo de Unicode?
Então, eu dei a Bruni uma screenshot para sua resposta para mostrar o que elas significavam. Mas então eu testei o resultado. Você pode, de fato, selecionar a codificação UTF-8 no gedit ou em qualquer outro editor de texto. No entanto, a menos que esses arquivos contenham caracteres não-ASCII **, eles serão detectados como ASCII. De fato, o mesmo vale se você criar um arquivo de "texto simples" (termo duvidoso *) por qualquer método, e esta resposta tem o motivo:
% bl0ck_qu0te% Eu desafio qualquer um a testar essa resposta; Eu só posso criar um arquivo de texto "UTF-8" no meu sistema adicionando caracteres não-ASCII, mesmo que todos os meus terminais, todos os meus editores de texto e meu locale
estejam configurados como UTF-8:
$ echo unicorns > rainbows; file rainbows
rainbows: ASCII text
redirecionando echo
cria um arquivo que file
diz ser ASCII (tente você mesmo!)
$ echo ユニコーン >> rainbows; file rainbows
rainbows: UTF-8 Unicode text
Anexar caracteres não-ASCII altera automaticamente a codificação? Não, apenas força file
para ver que realmente, a codificação é UTF-8, porque ela não pode mais ser limitada a ASCII.
Não se preocupe, seus arquivos de texto "ASCII" são arquivos UTF-8 disfarçados (seu UTF-8 não pode ser detectado), e serão analisados como você deseja & amp; espere.
* Você estava interessado o suficiente para perguntar, então talvez você já entenda o que o redator deste artigo está contando nos. Esta parte explica mais sobre codificação e, especificamente, por que ASCII!=UTF-8
e por que você precisa para saber como você codificou seu texto. Eu extraí:
** Fato divertido : @ByteCommander apontou para mim que file
apenas analisa os primeiros 50-100kb do arquivo, portanto, se houver caracteres não-ASCII longe do início de um arquivo de texto, então file
ainda achará que é ASCII.