Perguntas sobre 'unicode'

Unicode é o principal padrão para a representação e codificação do texto de sistemas de escrita díspares; A implementação mais comum da codificação de caracteres unicode, usada pelo Ubuntu e outros sistemas operacionais, é o UTF-8.
0
respostas

OpenSSL convertendo caracteres para literais UTF-8

Estou executando um aplicativo da Web PKI simples no Php que usa comandos do shell OpenSSL e armazena informações em um banco de dados de texto. Eu tenho que lidar com caracteres de entrada não-ASCII (por exemplo, alemão), mas quando um novo cer...
12.02.2016 / 10:54
2
respostas

Caracteres unicode suecos em xdm / xlogin

Eu decidi localizar minha tela de login do XDM, mas estou presa com caracteres suecos corrompidos. EstouusandooDebianWheezycomoseguinte/etc/X11/xdm/XresourcesXcursor.theme:whiteglassxlogin*login.translations:#override\CtrlR:abort-display()\n\...
01.09.2013 / 21:24
0
respostas

Emacs adicionando automaticamente BOM ao arquivo XML

Isso parece estar relacionado a discussão , mas eu tenho exatamente o caso de uso oposto. Não desejo inserir um BOM, mas emacs parece estar inserindo um no modo XML (sem estar em hexl-mode ). Estou usando o GNU Emacs 23.3.1. Eu tenho o...
09.03.2015 / 16:52
3
respostas

Usando uniq em texto unicode

Eu quero remover linhas duplicadas de um arquivo com palavras do script Syriac . O arquivo de origem tem 3 linhas, 1 e 3 são idênticas. $ cat file.txt ܐܒܘܢ ܢܗܘܐ ܐܒܘܢ Quando uso sort e uniq , o resultado presume que todas as 3 linha...
16.09.2018 / 10:47
2
respostas

utf-8 seqüência no console

quando eu executo o comando "tree" no console, aqui está o que eu tenho: . ├── Annexe\ 1\ -\ Sch31ma\ global\ de\ la\ base\ de\ donn31es.raw ... O resultado é composto de seqüências utf-8, preciso obter a string em um formato legível para...
13.05.2014 / 16:11
2
respostas

cp: quais aspas usadas em mensagens de erro?

Atualmente, estou mexendo em um disco rígido agonizante e, ao tentar cp dados dele, recebo erros como cp: error reading ‘brokenFile’: Input/output error # comparison: backtick: ', apostrophe ' Eu agora tento copiar os arquivos com falh...
25.04.2014 / 15:55
2
respostas

tr não substitui o apóstrofo [duplicado]

Eu quero converter todos os apóstrofos neste arquivo para X : Bob's book Bob’s book Bob′s book # (Might look the same but actually different) O primeiro apóstrofo é substituído conforme esperado: $ cat file | tr "'" "X" BobXs book...
19.09.2012 / 04:31
4
respostas

Como eu crio um arquivo de texto (1 gigabyte) contendo caracteres aleatórios com codificação de caracteres UTF-8?

O seguinte comando não usa UTF-8: head -c 1M </dev/urandom >myfile.txt     
26.11.2015 / 10:52
1
resposta

Por que não é possível pesquisar o conteúdo do arquivo de texto codificado em UTF-16?

Eu entendo que, por exemplo O catfish e o gnome-search-utils podem pesquisar dentro do conteúdo do arquivo codificado em UTF-8. Para poder pesquisar palavras ou números em arquivos de texto, é necessário convertê-los via iconv para UTF-8 primeir...
09.05.2017 / 17:33
2
respostas

Problema com a leitura do arquivo de texto codificado na codificação Ocidental (ISO-8859-1)

Estou tendo um problema com a codificação do arquivo de texto ISO-8859-1 (legendas em polonês), que é algo assim: Mieszka³ sam, | ¿adnej ¿ony, dzieci. Deverá ser: "Mieszkał sam, żadnej żony, dzieci". Eu tentei: convertendo o arquivo...
20.07.2016 / 01:11