Perguntas sobre 'character-encoding'

2
respostas

O mesmo arquivo, nome diferente devido ao problema de codificação?

Eu estava prestes a diferenciar um backup da fonte para verificar manualmente se os dados estão corretos. Alguns chars, como åäö, não são mostrados corretamente nos dados originais, mas como os clientes (sobre o samba) interpretam corretamente,...
07.03.2013 / 20:22
2
respostas

Como exibir caracteres chineses corretamente na máquina remota Red-Hat?

Estou usando o Ubuntu14.04 para conectar-me a um host remoto. Qual é sua versão: Versão 2.6.32-431.11.5.el6.yyyzzz.x86_64 do Linux (gcc versão 4.4.7 20120313 (Red Hat 4.4.7-4) (GCC)) # 1 SMP Qui 3 de julho 09:42:34 CST 2014 Meu arquivo...
09.08.2014 / 06:04
1
resposta

Como usar o grep / ack com arquivos em codificação arbitrária?

Na minha área de trabalho do Linux, eu tenho uma localidade UTF-8. Quando tento pesquisar alguns arquivos codificados em KOI8-R com grep (ack), ele falha. Se eu codificar manualmente o padrão em KOI8-R e passar isso como um argumento, ele funcio...
06.03.2012 / 15:55
3
respostas

“mv” arquivo com nome ilegível por número de inode?

Eu tenho vários arquivos com problemas de codificação em seus nomes de arquivos (trema alemã, gravada em CD com Windows, lida pelo Windows e sincronizada com o Linux com o Seafile. Algo em algum lugar deu errado ...). Bash e zsh mostram apenas "...
11.10.2015 / 15:28
5
respostas

Converte um arquivo ASCII com octal escapes para códigos UTF-8 para UTF-8

Eu tenho um arquivo de texto que é um arquivo ASCII em si, mas contém seqüências de escape octal representando códigos em utf-8: 07252066 Existe algum programa ou comando que pode converter tal arquivo ASCII para um arquivo de texto rea...
16.07.2015 / 01:11
2
respostas

O que seria quebrado se a localidade C fosse UTF-8 em vez de ASCII?

A localidade C é definida para usar o conjunto de caracteres ASCII e o POSIX não fornece uma maneira de usar um conjunto de caracteres sem alterar a localidade também. O que aconteceria se a codificação de C fosse trocada para UTF-8? O lad...
12.03.2013 / 17:31
3
respostas

Codificação mais comum para strings em C ++ no Linux (e Unix?)

Para criar um programa C ++ que seja portátil em nível de código-fonte entre o Windows e o Linux e lide bem com a internacionalização, há três codificações principais do IMHO a serem consideradas: A codificação do código-fonte do C ++. A c...
13.11.2011 / 14:24
4
respostas

printf: caracteres multibyte

Ao tentar formatar printf output envolvendo strings contendo caracteres de múltiplos bytes, ficou claro que printf não conta caracteres literais, mas o número de bytes, o que dificulta a formatação de texto se for byte único ou multi-byte...
16.11.2017 / 22:22
5
respostas

Como converter para código HTML?

Há algum script que possa converter entre texto (por exemplo, <hi> ) e a versão de entidades html ( &lt;hi&gt; ), como este site faz? Ou pelo menos um arquivo PHP?     
25.05.2011 / 17:17
1
resposta

Untar nomes de arquivos em uma codificação de caracteres diferente da codificação usada no sistema de arquivos

Ocasionalmente, recebo tarballs em que os nomes dos arquivos são codificados em ISO-8859-1 ou em outro esquema pré-Unicode. Meu sistema usa UTF-8, então quando eu descompactar esses arquivos com as opções usuais ( tar xvf foo.tar ) acabo com u...
08.09.2015 / 11:54