Perguntas sobre 'unicode'

Unicode é o principal padrão para a representação e codificação do texto de sistemas de escrita díspares; A implementação mais comum da codificação de caracteres unicode, usada pelo Ubuntu e outros sistemas operacionais, é o UTF-8.
0
respostas

cursor e combinando diacríticos no shell [closed]

Eu freqüentemente lidei com diacríticos combinados, especialmente a combinação de acento agudo (U0301 ou \xcc\x81 ). Eu tenho um teclado configurado para inserir esse caractere, e isso funciona bem no shell. $ echo а́ > а́ $ echo а́ | h...
13.08.2015 / 10:24
1
resposta

É seguro usar o tar mesmo que existam outros caracteres além do ASCII em nomes de arquivos e caminhos?

É seguro usar tar mesmo se houver outros caracteres que não sejam caracteres imprimíveis ASCII? Por exemplo, caracteres japoneses, caracteres chineses, caracteres de nova linha, etc. Há algum problema conhecido que possa fazer com que a...
01.12.2014 / 14:45
1
resposta

Como traduzir caracteres Unicode? [duplicado]

Estou tentando converter alguns caracteres para a forma de largura total como esta tr 'abcdefghijklmnopqrstuvwxyz' 'abcdefghijklmnopqrstuvwxyz' No entanto, isso não funciona. Fiz uma pesquisa e, ao que parece, tr não suporta UTF-8...
11.03.2018 / 07:09
2
respostas

Como fazer uma pesquisa em regex em um arquivo UTF-16LE em um locale UTF-8?

EDIT: Devido a um comentário Warren Young feito, me fez perceber que eu não estava claro em um ponto bastante relevante. Minha string de pesquisa já está na ordem UTF-16LE (não na ordem Unicode Codepoint, que é UTF-16BE), então talvez o proble...
09.06.2012 / 12:44
1
resposta

Procurando por um criador ISO

Eu estou procurando por um criador de imagens ISO, já tentei isomaster , mas ele não funciona com caracteres unicode, ele apenas toma isso como caracteres ruins, então qual outra ferramenta eu posso usar? Não preciso de iniciar, apenas arqu...
09.12.2012 / 08:01
2
respostas

Imprimir um caractere com um codepoint

Eu tenho uma lista de pontos de código como 0x13000, 0x1300A. Eu tenho que imprimir os caracteres Unicode correspondentes do bash. Eu já tentei fazer isso com outros comandos que encontrei pesquisando no fórum ( No bash, como posso converter um...
10.11.2016 / 15:44
2
respostas

Convertendo do ascii para o formato utf-8 - iconv não está funcionando [fechado]

Eu tenho um requisito para converter de formato de texto ASCII para UTF-8. Abaixo está o que estou executando por meio do comando iconv : [root@main tmp]# cat File1 1 5 6 [root@main tmp]# file File1 File1: ASCII text [root@main tmp]# ic...
09.08.2013 / 09:22
3
respostas

Como determinar a codificação de caracteres que um terminal usa em um programa C / C ++?

Eu notei que o SyncTERM usa uma codificação de caracteres diferente do emulador de terminal padrão do MacOS, e eles são incompatíveis entre si. Por exemplo, digamos que você queira imprimir um caractere de bloco em uma string de formato. No Sync...
12.11.2016 / 19:00
2
respostas

Os caracteres são codificados duas vezes quando peço ao SSH para reconectar uma sessão de tela no host remoto

Eu quero ser capaz de SSH para um host remoto e restaurar uma sessão de tela com um comando. Ambos os hosts usam a localidade UTF-8. Meu problema é que, dentro da sessão de tela, os caracteres são codificados duas vezes. Como afirmado em outr...
11.09.2014 / 08:35
1
resposta

console exibindo caractere de aspas do gcc wongly

Após uma atualização para o debian wheezy, meus consoles de texto exibem pontos de interrogação onde deve haver citações Em X, vejo as coisas corretamente window.cpp:1056:21: error: base operand of ‘->’ is not a pointer mas o consol...
10.08.2013 / 00:59