Perguntas sobre 'unicode'

Unicode é o principal padrão para a representação e codificação do texto de sistemas de escrita díspares; A implementação mais comum da codificação de caracteres unicode, usada pelo Ubuntu e outros sistemas operacionais, é o UTF-8.
3
respostas

Como substituir todas as substrings UTF-8 com codificação percentual por texto simples UTF-8?

Eu tenho um arquivo html com muito texto codificado em% UTF-8 em URLs. Por exemplo, "% D1% 80% D0% B5% D1% 81% D1% 83% D1% 80% D1% 81% D1% 8B" significa "ресурсы" ("recursos" em russo). A tarefa é substituir todas essas substrings por text...
04.12.2012 / 07:12
2
respostas

Processe um arquivo que comece com um BOM (FF FE)

Recebi um arquivo .csv com o FF FE BOM: $ head -n1 dotan.csv | hd 00000000 ff fe 41 00 64 00 20 00 67 00 72 00 6f 00 75 00 |..A.d. .g.r.o.u.| Ao usar awk para analisá-lo, estou obtendo vários bytes nulos, que suspeito serem devid...
15.06.2014 / 10:07
4
respostas

Como posso descompactar corretamente um arquivo ZIP de arquivos com nomes hebraicos?

Alguém me enviou um arquivo ZIP contendo arquivos com nomes em hebraico (e criados no Windows, não tenho certeza com qual ferramenta). Eu uso o LXDE no Debian Stretch. O gerenciador de arquivos do Gnome consegue descompactar o arquivo, mas os ca...
28.12.2015 / 18:47
1
resposta

Como alterar a fonte do console bash para exibir caracteres UTF-8

Estou tendo problemas para exibir caracteres UTF-8 corretamente no bash. Eu estava tentando extrair alguns arquivos compactados que continham caracteres acentuados em seus nomes, e eu estava recebendo o erro de caracteres multibyte inválido. Eu...
06.07.2011 / 17:47
2
respostas

Onde foi minha linha 'uniq' ou 'sort -u', com alguns caracteres unicode

O que está acontecendo no seguinte trecho de código? Eu não estou recebendo minha saída esperada. Eu acho que foi um bug, mas isso acontece por 2 programas diferentes (uniq e sort), então eu suspeito que é algo a ver com ... bem, eu não sei o...
22.07.2011 / 07:23
4
respostas

xterm não exibindo unicode

Eu nunca consegui fazer com que meu terminal exibisse símbolos unicode. por exemplo, antes de ter meu sistema operacional atual, mapeei ctrl + a para o mu grego no vim e ele funciona em outros computadores, mas não no meu xterm atual. aqui está...
14.04.2015 / 15:21
1
resposta

ImageMagick (ou outro) para texto UTF-8 para imagem

Estou tentando criar muitas imagens de caracteres únicos usando convert . O objetivo é fornecer a um especialista em plásticos imagens para imprimir nas teclas do teclado. A documentação do ImageMagick sugere algo assim: printf "\u231...
08.04.2014 / 22:19
2
respostas

Combinação de teclado para inserir caracteres sem teclado

no windows, é possível com Alt +235 imprimir em (qualquer) campo de texto. Eu tentei o mesmo no linux e parece não estar funcionando. Dependendo da aplicação, o resultado é diferente, mas nunca o desejado. Existe uma combinação similar no L...
25.04.2013 / 09:33
3
respostas

Existem emuladores de terminal que suportam texto bidirecional?

Eu tentei procurar por isso, mas saí de mãos vazias. É possível para mim fazer com que meu emulador de terminal exiba os clusters grafomas Unicode da direita para a esquerda corretamente? Caso de uso: Estou escrevendo um script que gera letra...
11.11.2013 / 20:31
2
respostas

Como montar uma unidade NTFS como utf8 sobre NFS

Pergunta Como montar um compartilhamento nfs (sistema de arquivos formatado em NTFS) como utf8 in CentOS 6.5 ? O que eu tentei mount -o iocharset=utf8 mount -o nfs=utf8 mount -o utf8=1 mount -o utf8 Problema: Quando eu c...
15.12.2013 / 08:21