Perguntas sobre 'character-encoding'

1
resposta

Alterar codificação de arquivo de texto sem conhecer a codificação de origem

Eu quero mudar a codificação do conjunto de caracteres para um arquivo no unix com um único comando, mas como esse será um processo automatizado, é impossível que eu saiba a codificação de origem. Então, eu quero um comando que altere a codif...
25.11.2014 / 22:37
1
resposta

Como adicionar suporte ao EBCDIC no debian / ubuntu

Eu tenho que adicionar suporte a texto EBCSIC para lidar com mensagens de texto do IBM OS. Eu adicionei um suporte EBCDIC a uma caixa CentOS adicionando idioma e codificação a /etc/i18n/sysconfig . Eu procurei nos documentos e o equivalente...
21.11.2013 / 09:29
3
respostas

sed, grep ou comando tr que retorna apenas caracteres latinos de um arquivo UTF-8

Estou trabalhando com o texto dos poemas sobre 300 tang , que infelizmente são um único arquivo contendo os termos chineses. e inglês. Como estou interessado em "extrair" o inglês, espero usar sed, grep, ou tr para simplesmente retornar t...
29.05.2011 / 14:26
1
resposta

Como traduzir caracteres Unicode? [duplicado]

Estou tentando converter alguns caracteres para a forma de largura total como esta tr 'abcdefghijklmnopqrstuvwxyz' 'abcdefghijklmnopqrstuvwxyz' No entanto, isso não funciona. Fiz uma pesquisa e, ao que parece, tr não suporta UTF-8...
11.03.2018 / 07:09
2
respostas

Imprimir um caractere com um codepoint

Eu tenho uma lista de pontos de código como 0x13000, 0x1300A. Eu tenho que imprimir os caracteres Unicode correspondentes do bash. Eu já tentei fazer isso com outros comandos que encontrei pesquisando no fórum ( No bash, como posso converter um...
10.11.2016 / 15:44
3
respostas

Como determinar a codificação de caracteres que um terminal usa em um programa C / C ++?

Eu notei que o SyncTERM usa uma codificação de caracteres diferente do emulador de terminal padrão do MacOS, e eles são incompatíveis entre si. Por exemplo, digamos que você queira imprimir um caractere de bloco em uma string de formato. No Sync...
12.11.2016 / 19:00
2
respostas

Comando Unix para converter a codificação de caracteres em um arquivo .csv

Eu preciso de um comando Unix para converter um arquivo .csv que está no formato UNICODE para o formato ANSI. O arquivo é importado do ambiente do Cognos e não posso fazer nenhuma alteração com o formato em cognos.     
19.10.2015 / 20:30
2
respostas

Como eu defino o conjunto de caracteres do servidor mysql no FreeBSD 8.2?

O conjunto de caracteres do servidor atual do meu servidor mysql é latin1 . Meu servidor é iniciado na inicialização através da configuração do rc.conf mysql_enable="YES" . Como definir meu servidor para usar utf8 como o conjunto de carac...
08.09.2012 / 04:25
1
resposta

Executando grep para uma string com caracteres sem renderização

Então eu tenho um arquivo log.txt que eu posso pesquisar no Notepad ++ no Windows, no entanto, devido ao grande número deles, eu gostaria de ser capaz de executar o grep neles. No entanto, os dados são formatados com caracteres que não são rende...
16.10.2015 / 12:21
2
respostas

Remove o símbolo de direitos autorais

Estou tentando analisar um feed RSS na linha de comando. O código funciona até agora, mas o feed contém um símbolo de direitos autorais que eu tento remover (é latin1 codificado). Como faço para remover o símbolo de direitos autorais ( \xA9 )...
18.11.2011 / 16:37