Perguntas sobre 'unicode'

Unicode é o principal padrão para a representação e codificação do texto de sistemas de escrita díspares; A implementação mais comum da codificação de caracteres unicode, usada pelo Ubuntu e outros sistemas operacionais, é o UTF-8.
5
respostas

Atualizei meu servidor arch linux e agora recebo o tmux: preciso do código de idioma UTF-8 (LC_CTYPE), mas tenho ANSI_X3.4-1968

Atualizei recentemente meu servidor Arch Linux e durante esse processo o tmux foi atualizado. Eu estava usando tmux enquanto a atualização estava em andamento e a usei depois, mas durante a mesma sessão SSH. Agora, no entanto, sempre que t...
20.04.2016 / 21:30
5
respostas

Como posso converter numerais persas em UTF-8 para algarismos europeus em ASCII?

Em numerais persas, ۰۱۲۳۴۵۶۷۸۹ é equivalente a 0123456789 em dígitos europeus. Como posso converter o número persa (em UTF-8 ) para ASCII? Por exemplo, quero que ۲۱ se torne 21 .     
19.06.2016 / 13:33
2
respostas

coreutils que estão cientes?

Quando usei cut hoje, descobri que ele não trata um caractere UTF-8 como um caractere, mas sim 3 caracteres porque ele tem 3 bytes. Isso parece ser geralmente verdadeiro para muitas ferramentas. Existem versões do coreutils que são c...
01.07.2011 / 23:45
3
respostas

Existe uma maneira universal de escrever caracteres Unicode?

Às vezes, quero escrever caracteres Unicode especiais, como um em-traço (-), em vários programas como vim, Chrome (como agora!) ou LibreOffice. No LibreOffice, posso conseguir isso por meio de uma caixa de diálogo dedicada, localizada no menu...
17.02.2015 / 21:48
2
respostas

grep: Encontre todas as linhas que contenham kanjis japoneses

Em um enorme arquivo de texto UTF-8, quero mostrar todas as linhas que contêm kanjis em japonês. . Que grep (ou outra) expressão faz isso? Se não me engano, os kanjis são os caracteres entre \u4e00 e \u4dbf . Eu não preciso mostr...
22.02.2013 / 08:30
2
respostas

UTF 8 nomes de arquivos?

Em sistemas operacionais baseados em Unix, os nomes de arquivos utf6 são permitidos? Em caso afirmativo, preciso fazer algo especial para gravar o arquivo no disco. Deixe-me explicar o que espero fazer. Eu estou escrevendo um aplicativo que i...
07.05.2012 / 03:48
4
respostas

Obtém a largura de exibição de uma string de caracteres

Qual seria o mais próximo de uma maneira portátil de obter a largura de exibição (em pelo menos um terminal (um que exibe caracteres na localidade atual com a largura correta)) de uma cadeia de caracteres de um script de shell. Estou interess...
23.11.2015 / 22:02
1
resposta

Como posso digitar caracteres Unicode no terminal Konsole do KDE a partir de um desktop Gnome?

Eu uso o Ubuntu .. Em 'gnome-terminal', eu posso digitar Codepoints Unicode primeiro digitando Ctrl-Shift-u seguido pelo valor hexadecimal Codepoint, por exemplo. C-S-u 2468 produz ⑨ konsole , meu terminal preferido, não possui esse rec...
28.04.2011 / 21:08
2
respostas

Como verificar se o arquivo tem uma lista de materiais no texto utf-8

Como posso verificar se um arquivo de texto utf-8 possui um BOM na linha de comando? O comando file mostra-me UTF-8 Unicode text . Mas não sei o que significa que não há lista de materiais no arquivo. Estou usando Ubuntu 12.04 ....
01.12.2014 / 04:40
2
respostas

O vim pode exibir somente caracteres ASCII e tratar outros bytes como dados binários?

Eu já conheço vim -b , no entanto, dependendo da localidade usada, ele exibe caracteres de multibyte (como UTF-8) como letras únicas. Como posso pedir ao vim para exibir apenas caracteres imprimíveis ASCII, e tratar o resto como dados bi...
06.01.2014 / 02:22