Perguntas sobre 'unicode'

Unicode é o principal padrão para a representação e codificação do texto de sistemas de escrita díspares; A implementação mais comum da codificação de caracteres unicode, usada pelo Ubuntu e outros sistemas operacionais, é o UTF-8.
1
resposta

O console Linux não pode exibir nenhum idioma além do inglês enquanto o terminal sob o Gnome pode

Ainda sou novo em sistemas Linux e Unix e tentei pesquisar na internet sobre o meu problema. Infelizmente não recebo uma resposta viável agora. Meu problema é que o console (tty) no meu Debian Linux não pode exibir nenhum outro idioma além do...
30.03.2016 / 10:08
1
resposta

O XTerm não exibe corretamente * alguns * caracteres unicode?

Eu não tenho um problema geral com XTerm e Unicode. Na maioria das vezes, as coisas estão funcionando. Isso funciona muito bem: $ echo "¿dónde está la llama?" ¿dónde está la llama? Como isso: $ echo -e "\xE2\x98\xA0" ☠ Mas isso f...
03.05.2016 / 17:58
1
resposta

Configure o Postfix e o Dovecot-LMTP para receber mensagens via SMTPUTF8?

Estou executando um servidor Postfix que usa o Dovecot LMTP para entrega de mensagens. Eu estou fazendo isso porque ele joga bem com peneira. No entanto, recebi alguns emails recentemente com Unicode na linha de assunto. Este e-mail é rece...
31.10.2016 / 15:55
2
respostas

Ordenar linhas por valor unicode

Estou tentando classificar um arquivo de texto linewise pelos seus valores Unicode. Tanto quanto eu posso dizer, isso significa numerais primeiro, depois letras, depois CJK-Ideographs. No entanto, sort (com LC_ALL=C ) falha terrivelmente ne...
13.03.2013 / 22:42
2
respostas

Alguns caracteres UTF-8 não são reconhecidos pelo grep ou sed

Tentando determinar todos os caracteres em um arquivo. O arquivo sample consiste em: a eɪ abandon əˈbændən ability əˈbɪləti able ˈeɪbəl able ˈeɪbl abortion əˈbɔrʃən abortion əˈbɔrʃn about əˈbaʊt above əˈbʌv abroad əˈbrɔd A localidad...
09.08.2013 / 17:10
3
respostas

Como converter arquivo unknown-8bit para utf8

Eu tenho um arquivo .srt que aparece como rabisco quando o abro no gEdit no Ubuntu. Então eu quero convertê-lo para utf8 para poder lê-lo. Quando tento descobrir qual é a codificação: file -i x.srt x.srt: text/plain; charset=unknown-8bit...
12.02.2015 / 20:33
2
respostas

Acentos UTF-8 incorretos no vi / vim no OpenBSD 6.2

Após uma instalação padrão do OpenBSD 6.2 com o FVWM, eu abro um xterm na GUI do FVWM, com um usuário normal, crie um arquivo de teste: $ echo 'árvíztűrő tükörfúrógép' > test.txt $ echo 'ÁRVÍZTŰRŐ TÜKÖRFÚRÓGÉP' >> test.txt $ $ cat t...
31.12.2017 / 14:52
1
resposta

Editor de texto com seleção de tamanho de fonte para linguagens humanas específicas (por exemplo, Unicode Block) eg Devanagari

Pré Linux, eu usei Windows .. (muitos anos no deserto :) ... no entanto, houve um raio de sol entre todos os vírus gerais / reinstalar flack .. e isso foi Notepad + +, um texto Editor eu realmente gosto de (d). Eu provavelmente ainda estaria...
05.02.2011 / 03:00
1
resposta

AWK com BOM: Existe alguma maneira legal de lidar com Unicode BOM com regexp?

Eu tenho dois arquivos codificados em UTF-8 com / sem BOM: /tmp/bom$ ls list.bom.txt list.nobom.txt /tmp/bom$ cat list.nobom.txt apple banana avocado 寿司 melon /tmp/bom$ diff list.nobom.txt list.bom.txt 1c1 < apple --- > apple /tmp/bo...
20.01.2017 / 10:56
2
respostas

Digitando caracteres Unicode por nome

O Emacs tem o recurso insert-char : você pressiona uma combinação de teclas e obtém um menu contendo todos os caracteres Unicode com pesquisa semelhante a dmenu e a maioria dos lançadores de programas do DE. Por exemplo, para inserir "∃"...
31.05.2017 / 09:58