Perguntas sobre 'unicode'

Unicode é o principal padrão para a representação e codificação do texto de sistemas de escrita díspares; A implementação mais comum da codificação de caracteres unicode, usada pelo Ubuntu e outros sistemas operacionais, é o UTF-8.
2
respostas

Como posso fazer com que símbolos unicode e fontes truetype funcionem no xterm / uxterm?

Gostaria de usar uma fonte truetype no xterm / uxterm (versão 278), mas obtenho problemas com símbolos unicode (por exemplo, é exibido corretamente, por isso não é um problema utf8 ou locale desativado): $ echo -e "\xE2\x98\xA0" me dá um...
27.06.2014 / 12:10
2
respostas

iconv sequência de entrada ilegal - por quê?

Ao tentar converter um arquivo de texto em seu equivalente ASCII, recebo uma mensagem de erro de que iconv: illegal input sequence at position . O comando que eu uso é iconv -f UTF-8 -t ascii//TRANSLIT file O caractere incorreto é æ...
09.07.2014 / 15:53
2
respostas

UTF8 símbolos matemáticos e layout de teclado / entrada

Eu gostaria de usar símbolos matemáticos UTF8 ao digitar uma lista , uma outra lista . Encontrei algo chamado ComposeKey . Infelizmente não está cobrindo omega, theta, seta para a direita, etc. Estou usando o KDE, tentei atalhos globais,...
04.10.2011 / 10:50
4
respostas

suporte para codificação utf-8 com lpr

Ao tentar enviar um arquivo de texto para a impressora via lpr de xterm , o conteúdo foi corrompido além do reconhecimento, cuja causa foi rastreada até a codificação do arquivo. Se eu processar o texto com iconv (por exemplo, iconv -f...
16.08.2014 / 09:04
4
respostas

Como posso identificar um personagem estranho?

Estou tentando identificar um caractere estranho que encontrei em um arquivo com o qual estou trabalhando: $ cat file � $ od file 0000000 005353 0000002 $ od -c file 0000000 353 \n 0000002 $ od -x file 0000000 0aeb 0000002 O arquivo está...
28.04.2017 / 14:58
3
respostas

Como converter arquivos txt UTF-8 para todos os maiúsculos no bash?

Eu tenho alguns arquivos .txt UTF-8 que gostaria de converter em maiúsculas. Se fosse apenas ASCII, eu poderia usar: tr [:lower:] [:upper:] Mas como estou trabalhando com diacríticos e coisas assim, não parece funcionar. Eu acho que pode...
30.07.2013 / 18:55
2
respostas

Especifique a codificação com libreoffice --convert-to csv

Os arquivos do Excel podem ser convertidos em CSV usando: $ libreoffice --convert-to csv --headless --outdir dir file.xlsx Tudo parece funcionar bem. A codificação, no entanto, está definida como algo instável. Em vez de um mdash UTF-8 (-...
02.02.2016 / 17:33
2
respostas

Como imprimir nomes de glifos Unicode para string de entrada?

Gostaria de poder correr unicode-names 'abç' e veja os nomes dos caracteres Unicode correspondentes: LATIN SMALL LETTER A LATIN SMALL LETTER B LATIN SMALL LETTER C WITH CEDILLA Imprimir uma string como uma série de nomes de glifo U...
15.03.2012 / 17:03
2
respostas

Não pode usar 'cut -c' ('- caracteres') com UTF-8?

O comando cut tem uma opção -c para trabalhar em caracteres, em vez de bytes com a opção -b . Mas isso parece não funcionar, em en_US.UTF-8 locale: O segundo byte fornece o segundo caractere ASCII (que é codificado da mesma forma e...
23.10.2014 / 07:56
2
respostas

Como descobrir quais pontos de código unicode são definidos em um arquivo TTF?

Eu preciso automatizar um processo de verificação que caracteres Unicode têm glifos reais definidos para eles em um arquivo True Type Font. Como eu vou por aí fazendo isso? Não consigo encontrar informações sobre como entender os números que par...
03.12.2015 / 13:00