Perguntas sobre 'unicode'

Unicode é o principal padrão para a representação e codificação do texto de sistemas de escrita díspares; A implementação mais comum da codificação de caracteres unicode, usada pelo Ubuntu e outros sistemas operacionais, é o UTF-8.
1
resposta

iconv gerando UTF-16 com BOM

Inspirado por esta pergunta , posso usar o iconv comando para gerar a saída UTF-16 com uma BOM e com o endianness especificado? O comando iconv converte texto de uma codificação para outra. Por exemplo: echo hello | iconv -f asci...
22.01.2012 / 02:46
3
respostas

Obtenha o suporte para Unicode Ranges a partir do arquivo Font * .ttf no Ubuntu

Eu tenho algumas fontes no formato 'ttf' na minha máquina Ubuntu. Eu quero saber alguns metadados dessas fontes, sobre quais intervalos de unicode e quais páginas de códigos não unicode esses arquivos de fonte são supporte. Como posso faze...
06.04.2012 / 15:49
1
resposta

O ls do Ubuntu pode mostrar caracteres unicode, mas a árvore não pode, mesmo com unicode tree --charset

O ls do Ubuntu 10.04 pode mostrar caracteres unicode, mas tree não pode, mesmo com tree --charset unicode ou utf8 . Existe uma maneira de resolvê-lo. echo poderia interpretar os caracteres de escape, exceto cat list.txt | echo -e...
27.06.2010 / 03:50
3
respostas

Vim: Como lidar com arquivos Unicode com texto em vários (mais de dois) idiomas?

Quais configurações eu preciso definir no Vim / gVim para poder ver o Unicode arquivos de texto com texto em vários idiomas? Você pode fazer essas suposições: O número de idiomas é mais do que dois. Alguns dos idiomas são chinês, japo...
22.07.2009 / 05:07
2
respostas

Por que os posts do Craigslist estão cheios de pontos de interrogação?

Não há presença craigslist na minha cidade, mas às vezes eu navego no "melhor de" porque é engraçado ou interessante. Por que algumas postagens estão cheias de pontos de interrogação? Parece que toda a pontuação, exceto vírgulas e pontos fi...
13.08.2009 / 03:06
2
respostas

Localiza arquivos com caracteres não-ASCII em nomes de arquivos no Windows XP

Existe alguma maneira fácil de encontrar todos os arquivos em um determinado diretório que possuam caracteres não-ASCII (isto é, Unicode) no nome do arquivo? Estou executando o Windows XP x64 SP2, sistema de arquivos NTFS.     
25.01.2011 / 11:14
1
resposta

Caracteres Unicode são exibidos incorretamente no KDE e no console no Arch Linux

Eu recentemente mudei do OpenSuSE para o Arch Linux. Arquivos com caracteres unicode no nome usado para exibir bem, mas depois da transição acabei de receber mojibake. Por exemplo, na minha biblioteca musical Queensrÿche aparece como Queensr¿che...
27.02.2012 / 15:18
6
respostas

A saída unilog do Robocopy é sem sentido

Eu tentei obter o robocopy no Windows 7 para gerar um log Unicode, já que tenho arquivos com caracteres Unicode. O comando que usei: robocopy C:\mysource D:\mydest /mir /unilog:backup.log /tee Arquive a cópia e a saída na tela está corret...
12.06.2011 / 00:57
3
respostas

Por que alguns caracteres unicode estão faltando no charmap?

No Windows, o Mapa de Caracteres não parece exibir todos os caracteres unicode, mesmo que a fonte selecionada os suporte, e o seletor "Conjunto de Caracteres" é "Unicode". Por exemplo, o pequeno envelope U + 2709 ✉ nunca é exibido, mesmo se o...
01.01.2012 / 12:15
2
respostas

No agrupamento utf-8, por que 11- é menor que 1-?

Descobri que o resultado da classificação em ASCII: Arquivo de origem test : 1- 11- 1-a 11-a Classifique usando ASCII: $ LANG=en_US.ascii sort test 1- 1-a 11- 11-a E usando o UTF-8: $ LANG=en_US.utf8 sort test 1- 11- 11-a 1...
01.01.2011 / 14:32