codificação de caracteres em sistemas linux

3

Eu tenho página da web seu conjunto de caracteres é 8859-9 e foi preparado em janelas com codificação de caracteres ascii. de acesso ftp, eu estou abrindo via gedit no ubuntu, em seguida, chars turcos muda como (turco tornou-se ý). o que posso fazer para evitar esse tipo de coisa estúpida?

    
por edib 11.08.2011 / 11:02

2 respostas

2

Você já tentou definir sua localidade como tr_TR.ISO-8859-9

Para descobrir qual é a sua localidade atual, use o comando locale sem argumentos. Ele irá imprimir os valores de todas as variáveis de ambiente relevantes, exceto para LANGUAGE. locale charmap imprime o nome da codificação atual. Para descobrir quais locais estão disponíveis, digite locale -a . Para descobrir quais codificações estão disponíveis, digite locale -m .

Se você usar o diálogo de abertura de arquivo do gedit, poderá escolher uma codificação apropriada para o arquivo que está abrindo.

Se o acima não ajudar, atualize sua pergunta com a saída de file filename e dez linhas relevantes de saída de hexdump -C filename

what can I do to avoid this kind of stupid things?

Use utf-8 para tudo em todos os lugares em todos os momentos. Converta qualquer coisa que não seja utf-8 em utf-8 usando iconv ou recode . Certifique-se de que todas as fontes que você usa suportam os scripts que você usa (ou seja, têm glifos para os intervalos de unicode relevantes).

    
por 11.08.2011 / 11:12
2

Você pode converter com iconv :

$ iconv -f iso-8859-1 -t utf-8 somefile.latin1 > somefile.utf8

$

Uma alternativa para iconv é para recode . Se ainda não for conhecido, você pode descobrir o conjunto de caracteres com o comando file :

$ file somefile.latin1
somefile.latin1: ISO-8859 text

$
    
por 11.08.2011 / 11:23