Quais são as codificações padrão nos sistemas operacionais atuais?

1

Quais são as codificações padrão no Mac, Unix e outras?

Eu sei que se meu amigo que usa o Windows me enviar um arquivo, provavelmente ele será codificado em cp1251 . Então, em emacs , posso fazer: revert-buffer-coding-system e escolherá cp1251 .

    
por Adobe 23.09.2011 / 12:30

1 resposta

7

Não há " a codificação padrão", você tem muitos deles.

UTF-8 , uma codificação Unicode, é a mais comumente usada atualmente. É o padrão na maioria das distribuições Linux, bem como muitos clientes de email em outras plataformas. No Windows, "Unicode" geralmente se refere a UTF-16, que é apenas outra representação do mesmo Unicode.

Outras codificações foram caindo lentamente em desuso, devido a suas limitações e incapacidade de usar vários idiomas no mesmo arquivo.

  • O mais "padrão" deles seria as codificações ISO 8859 , principalmente ISO 8859-1 para "Europa Ocidental".

  • Suas homólogos do Windows são muito semelhantes; o mais comum é o Windows-1252 também conhecido como cp1252 , um superconjunto da ISO 8859-1 . (Seu cp1251 é para script cirílico.)

  • Outras codificações, como KOI8-R e Shift-JIS, também são usadas.

Veja também uma lista de codificações de caracteres .

Um script em Python chamado chardet é capaz de adivinhar com exatidão a codificação usada em determinados arquivos.

    
por 23.09.2011 / 12:46

Tags