Perguntas sobre 'unicode'

Unicode é o principal padrão para a representação e codificação do texto de sistemas de escrita díspares; A implementação mais comum da codificação de caracteres unicode, usada pelo Ubuntu e outros sistemas operacionais, é o UTF-8.
1
resposta

Posso escrever um programa de console que funcione com várias codificações de caracteres? [duplicado]

Estou escrevendo um programa de console em C. Espero que o Terminal em que meu programa esteja executando tenha sua codificação de caracteres definida como UTF-8. Isso significa que estou enviando strings codificadas em UTF-8 para o Termina...
06.06.2018 / 12:12
1
resposta

centos locale utf-8

Esta é minha caixa de linux: versão CentOS Linux 6.0 (final) x86_64 Usando um editor de texto (vi, ou pico ...), vejo caracteres estranhos para letras acentuadas (è, ì, à, ù) Esta é minha localidade: LANG=en_US.UTF-8 LC_CTYPE="en_...
24.11.2011 / 00:15
2
respostas

Por que esta regex encontra uma correspondência para \ x63 com um padrão [\ 80- \ BF]?

Estou tentando filtrar bytes UTF-8 válidos / inválidos, mas obtenho resultados estranhos da regex a seguir (destinada a manipular um formato de 3 bytes de UTF-8). Eu pretendia que o padrão não não correspondesse aos bytes de teste '\xE0\xA...
04.05.2011 / 20:36
2
respostas

Processar arquivos Unicode com BOM corretamente com ferramentas POSIX

Tentando usar grep hoje, me deparei com o problema familiar do Byte Order Mark (BOM) em um arquivo Unicode (UTF-8, neste caso). Especificamente, eu estava tentando encontrar um arquivo começando com XYZ com o padrão grep '^XYZ' , mas...
03.01.2018 / 00:56
1
resposta

Problemas com a localidade; Não é possível fazer o Arch Linux usar o UFT-8 [closed]

Nota: Os problemas reais por trás disso são apresentados he re , conforme um recomendação no meta. Esta questão deve ser encerrada como um tópico não reproduzível, porque seu principal problema é resolvido corrigindo um erro de digitação....
13.01.2014 / 00:00
3
respostas

Por que estou recebendo um erro “print_unicode: linha 9: printf: faltando um dígito unicode para \ u Unicode 0187” com este script

Eu os escrevi seguindo o shell script para ver como os caracteres Unicode se parecem no meu terminal. #!/bin/bash X=0 while [ $X -lt 65536 ]; do HEX='bc <<< "obase=16; $X"' HEX="0x${HEX}" UCODENAME='printf "%0*x\n" 4 $H...
29.03.2016 / 23:19
1
resposta

O que é uma fonte sans limpa que suporta UTF-8, que é adequada para o uso do console?

Estou procurando uma fonte para o meu console que suporte os caracteres utf-8 mais exclusivos. (como ► λ ✔ ✘ ✘ ✘ ➤ ✖ ❯ ❮ ✚ ✹ ➜ ═ ✭). Apesar de alguns googling, não consegui encontrar uma fonte que eu goste. Alguma sugestão? Estou usando o...
22.12.2015 / 18:56
1
resposta

curl com o Umlaut causa “erro de análise JSON: byte médio 0x22” do UTF-8 inválido [duplicado]

Estou executando o comando abaixo curl na linha de comando (Git Bash no Windows) ou como parte de um script Bash. curl -s -X POST -H "Content-Type: application/json" -H "Accept: application/json" -d "{\"testField\":\"ä\"}" https://someurl.....
02.05.2018 / 21:55
1
resposta

create unix alias para “ssh username @”, e gostaria de usá-lo para qualquer ipaddress. [duplicado]

crie unix alias para "ssh username @", e eu gostaria de usá-lo para qualquer endereço IP. por exemplo, alias go="username @" usecase: $ go 10.1.1.1; implementar = > ssh [email protected] Atualmente, se eu fizer $ go 10.1.1.1, ele esta...
07.11.2017 / 15:21
1
resposta

Corresponde apenas letras ASCII na expressão regular, ignorando os trema

Eu uso um regex no meu script bash como REGEX="^[a-zA-Z0-9\-]+$" Eu quero filtrar todas as palavras não padrão, especialmente aquelas que contêm caracteres especiais em alemão äöüÄÖÜß mas de acordo com este manual se você definir...
05.09.2017 / 13:05