Perguntas sobre 'character-encoding'

2
respostas

Wget retornando binário em vez de html?

Estou usando o wget para baixar uma página HTML estática. O Validador do W3C informa que a página está codificada em UTF-8. No entanto, quando cato o arquivo após o download, recebo um monte de binário absurdo. Estou no Ubuntu e achei que a codi...
06.11.2016 / 21:29
2
respostas

O vim pode exibir somente caracteres ASCII e tratar outros bytes como dados binários?

Eu já conheço vim -b , no entanto, dependendo da localidade usada, ele exibe caracteres de multibyte (como UTF-8) como letras únicas. Como posso pedir ao vim para exibir apenas caracteres imprimíveis ASCII, e tratar o resto como dados bi...
06.01.2014 / 02:22
3
respostas

Imprimindo decimal para o caractere ascii, meu comando não exibe como pretendido

Eu queria produzir uma string de todos os caracteres ascii com o seguinte comando for i in 'seq 32 127'; do printf "%c" $i; done A saída do comando acima é: 33333334444444444555555555566666666667777777777.............. É o primeiro...
04.08.2012 / 12:39
4
respostas

Como definir a codificação de fallback para UTF-8 no Firefox?

Eu escrevi um documento com o markdown norueguês: $ file brukerveiledning.md brukerveiledning.md: UTF-8 Unicode text Eu o converti para HTML usando o comando markdown : $ markdown > brukerveiledning.html < brukerveiledning.md...
07.09.2016 / 20:40
2
respostas

Diversas questões sobre a codificação de caracteres do sistema de arquivos no linux

Devido a muita troca de arquivos, o Windows ( GBK é codificado) e o Linux ( codificação UTF-8 , encontrará problemas de codificação de caracteres facilmente, como: arquivos zip / tar cujo nome contém caracteres chineses no sistema Windows,...
22.06.2011 / 12:09
3
respostas

Como corrigir letras russas em um aplicativo Wine ao ajustar o LANG não ajuda?

Um aplicativo com uma interface do usuário russa mostra pontos de interrogação, em vez da maior parte de seu texto (alguns elementos são processados ok embora). A localidade do sistema é o inglês (en_US, en_IE), eu tentei o Ubuntu ant XUbuntu...
17.05.2012 / 19:13
2
respostas

Quais codificações de caracteres são suportadas pelo posix?

O POSIX define o comportamento de ferramentas como grep , awk , sed , etc., que trabalham com arquivos de texto. Como é um arquivo de texto, acho que há o problema da codificação de caracteres. Pergunta: Quais são as codificações de...
12.06.2016 / 08:01
2
respostas

iconv sequência de entrada ilegal - por quê?

Ao tentar converter um arquivo de texto em seu equivalente ASCII, recebo uma mensagem de erro de que iconv: illegal input sequence at position . O comando que eu uso é iconv -f UTF-8 -t ascii//TRANSLIT file O caractere incorreto é æ...
09.07.2014 / 15:53
2
respostas

terminal: exibindo caracteres especiais

Em alguns programas, como htop , as linhas e quadros não são exibidos corretamente. Em vez disso, eles são exibidos como - e / . Masemoutramáquina,elessãoexibidoscorretamentecomolinhasadequadas: Não tenho certeza se isso é um proble...
26.10.2013 / 13:46
2
respostas

Por que wc -m e wc -c são diferentes?

Como programador C, fiquei surpreso ao ver que wc -c (que conta o número de bytes) e wc -m (que conta o número de caracteres) geram resultados muito diferentes para um longo arquivo de texto meu . Sempre me disseram que sizeof(char) é 1...
16.10.2012 / 02:43