Perguntas sobre 'unicode'

Unicode é o principal padrão para a representação e codificação do texto de sistemas de escrita díspares; A implementação mais comum da codificação de caracteres unicode, usada pelo Ubuntu e outros sistemas operacionais, é o UTF-8.
3
respostas

Quebra condicionalmente colunas em 2 linhas?

Eu tenho um arquivo no formato de: ⌚..⌛ watch..hourglass ⌨️ keyboard ⏏️ eject button Onde algumas linhas contêm duas entradas. Eu quero quebrar linhas com 2 entradas em 2 linhas assim: ⌚ watch ⌛ hourglas...
21.08.2017 / 17:16
3
respostas

Como contar o número de linhas em um arquivo UTF-16LE / CR-LF / BOM?

O pensamento imediato é wc , mas então o próximo pensamento não tão imediato é ... O wc do * nix é puramente para * nix terminações de linha \ x0a? ... Parece que sim. Eu já passei por isso, mas sinto que pode / deve ser uma maneira mais...
31.05.2012 / 13:03
6
respostas

Existe uma substituição (leve) para 'rxvt-unicode'?

Atualmente, estou usando rxvt-unicode como emulador de terminal. Como eu também gosto da configurabilidade de emuladores de terminal do GNOME e do KDE, gostaria de saber se existe algum tipo de substituição para rxvt-unicode com mais rec...
19.08.2010 / 22:10
2
respostas

Como eu digito caracteres unicode arbitrários no xterm?

Evitar o uso do gnome-terminal e terminator, pois eles são terrivelmente lentos. (20 a 30 segundos para mudar o foco para eles por qualquer motivo) O xterm é legal e rápido. No entanto, eu preciso ser capaz de digitar certos caracteres unicod...
02.05.2016 / 00:11
1
resposta

Como obter a ordenação unix na mesma ordem que Java (por valor unicode)

Eu descubro a classificação para o comando unix sort em um programa Java que eu escrevi. No entanto, estou tendo problemas decorrentes da comparação de strings do Java se comportando de maneira diferente das comparações feitas por classificação....
16.02.2012 / 23:36
1
resposta

Charset / font no console do Linux

Eu quero escrever um jogo que seja executado em um terminal. Eu faço um pouco de coloração de terminal e queria usar alguns caracteres unicode para arte gráfica "ascii". Mas muitos caracteres unicode não são suportados no terminal linux (o termi...
19.03.2011 / 22:16
1
resposta

Por que o uniq está ignorando Unicode e linhas com uma única letra?

Estou tentando combinar os dicionários americano e britânico em um grande dicionário, e estou tentando remover todas as duplicatas do superconjunto, mas parece que o uniq não está emitindo palavras como "épée" ou single letras. Isso é o que e...
04.02.2013 / 21:26
4
respostas

Como determinar se a localidade atual usa a codificação UTF-8?

Gostaria de determinar se a localidade do usuário usa a codificação UTF-8. Isso parece um pouco feio: [[ $LANG =~ UTF-8$ ]] && echo "Uses UTF-8 encoding.." existe uma maneira mais geral / portátil?     
18.06.2015 / 18:14
3
respostas

Contagem de caracteres da linguagem X no arquivo de texto misto?

Tenho arquivos de texto em vários idiomas e gostaria de contar o número total de caracteres imprimíveis de um dos idiomas. Ajuda que as linguagens habitam diferentes faixas unicode. Meu caso de uso específico envolve hebraico, grego polônico...
20.06.2017 / 13:48
1
resposta

Usando caracteres UTF-8 com programa de mensagem 'write'

quando eu uso o programa write para enviar mensagens, como posso usar caracteres UTF-8? Eu envio: write user2 Ehilà! Com'è? Mas o destinatário recebe: Message from user1@samehost on pts/1 at 21:08 ... EhilM-CM- ! Com'M-CM-(?...
31.05.2012 / 21:16