Perguntas sobre 'unicode'

Unicode é o principal padrão para a representação e codificação do texto de sistemas de escrita díspares; A implementação mais comum da codificação de caracteres unicode, usada pelo Ubuntu e outros sistemas operacionais, é o UTF-8.
1
resposta

Nomes de arquivos cirílicos quebrados após a atualização do Slackware

Após atualizar o glibc e algumas outras bibliotecas no Slackware, em vez de nomes cirílicos, vejo o lixo: | Was before | Is now | |------------+------------------| | Вождение | вождение | Qual poderia ser o problema? E...
12.05.2015 / 17:30
2
respostas

Caracteres unicode ausentes

Acabei de mudar do KDE para o ambiente leve + xmonad e minhas fontes não estão sendo processadas corretamente. Eu uso a família de fontes DejaVu (padrão para Debian 7.x) que suporta todos os caracteres que eu preciso (Prova: eu procurei ess...
28.01.2014 / 10:24
1
resposta

Ordenação incorreta de acordo com en_US.UTF-8

Estou vendo um comportamento estranho do comando sort quando eu ordeno por en_US.UTF-8. Estou tentando classificar este arquivo (LC_COLLATE = en_US.UTF-8 sort testdata): 㐀 㐃㐄 ▼▽◢ ㎏㎜㎝ bqz ㄠㄨㄩ─┃┆ ◆□■△ ぁあぃ...
17.06.2013 / 11:37
3
respostas

Inserir caracteres Unicode no login do console

Minha senha contém caracteres "especiais", como ü . Como posso fazer o login no console (sem X em execução) quando o layout de teclado padrão não fornece esses caracteres? Ou, de forma diferente: como posso inserir caracteres Unicode arb...
05.03.2013 / 00:53
2
respostas

Como instalo a localidade cs_CZ.ISO8859-2 no Ubuntu 12.04

Eu preciso que a localidade cs_CZ.ISO8859-2 exista no Ubuntu 12.04 para que um teste unitário específico possa ser aprovado. O teste faz a seguinte chamada: std::locale("cs_CZ.ISO8859-2") Na minha instalação do OS X Lion, esta localidade...
15.05.2012 / 17:20
1
resposta

Como reativar o atalho Ctrl + Shift + U no Cinnamon Mint 17.3?

O atalho Ctrl+Shift+U para gravar caracteres Unicode parece funcionar dentro da barra de pesquisa do gerenciador de software. Em qualquer outro lugar, como Gedit, Terminal e Google Chrome, pressionar Ctrl+Shift+U não ativa nenhum comportam...
30.01.2016 / 04:36
1
resposta

Como apagar símbolos unicode no terminal?

Alguns símbolos ocupam duas células de caracteres. Considere este script: #!/usr/bin/env bash echo '银^Htest' echo 'а^Htest' Saída: test test Como eu sei seus pontos de código de símbolos fullwidth? Algum tipo de regex para isso? C...
28.01.2016 / 14:06
2
respostas

Como pesquisar e substituir caracteres duplos por caracteres únicos Unicode em um arquivo truncado?

Eu tenho um arquivo de texto muito longo em francês que preciso limpar. Os caracteres não ASCII foram substituídos pela combinação de caracteres ímpares. Como exemplo, o seguinte conteúdo: passer de très bonnes fés de fin d'année. deve se...
22.12.2014 / 17:53
1
resposta

Como remover strings russas e arábicas de um arquivo de texto

Problema: Eu tenho arquivo de texto com aproximadamente 1 milhão de linhas, cada linha consiste em várias palavras Algumas linhas contêm palavras em russo ou árabe (vamos chamá-las de "linhas ruins"), quero remover apenas essas linhas ruins. O...
21.10.2014 / 18:10
1
resposta

Imprimindo texto UTF-8 (incluindo chinês)

Estou tentando imprimir uma grande quantidade (vários megabytes) de texto codificado em UTF-8, que consiste em caracteres chineses e latinos (e talvez um punhado de outros). Eu gostaria de imprimi-lo em várias colunas por página, em uma fonte co...
20.11.2013 / 00:27