Unicode vs. ASCII [fechado]

3

Por que o Unicode é usado nos sistemas operacionais mais recentes em vez do ASCII?

    
por STEPHEN 08.03.2011 / 18:52

3 respostas

5

Porque ele fornece um mapeamento fácil e uniforme de todos os caracteres atualmente em uso sem ter que alternar as páginas de código. Além disso, você provavelmente quer dizer EASCII ou ANSI (ou algum outro derivado com 256 caracteres).

Para dar um exemplo: usar o russo e o tcheco no mesmo sistema seria impossível há algum tempo (ou seja, sem Unicode), porque as páginas de código teriam entrado em conflito. Assim, nomes de arquivos (entre outros objetos) teriam sido exibidos incorretamente para qualquer um, dependendo da página de código selecionada no momento.

O Unicode atenua isso e adiciona alguns outros conceitos. Para uma boa visão geral, posso recomendar "Unicode Explained" da O'Reilly. Além disso, é escrito por alguém que se preocupa com a internacionalização, que não pode ser dito - mesmo agora - de muitos falantes nativos de inglês, pois o ASCII (0.127) pode ser usado para cobrir todas as sentenças em inglês e não há problemas com páginas de códigos. usando EASCII contanto que você fique com caracteres latinos simples.

Embora as implementações sejam diferentes (o Debian usa o UTF-8, enquanto o Windows mais recente usa o UTF-16 e o Windows NT mais antigo usa o UCS-2, um subconjunto do UTF-16), o Unicode elimina todas as limitações impostas pelas páginas de código , que é o argumento matador para usá-lo.

Se você está interessado em programação, dê uma olhada na UTI.

    
por 08.03.2011 / 19:03
4

Resposta curta: porque o Unicode suporta mais caracteres que o ASCII.

De Wikipedia :

Unicode is intended to address the need for a workable, reliable world text encoding. Unicode could be roughly described as "wide-body ASCII" that has been stretched to 16 bits to encompass the characters of all the world's living languages. In a properly engineered design, 16 bits per character are more than sufficient for this purpose.

    
por 08.03.2011 / 19:01
-2

O UTF-8 foi projetado desde o início para ser compatível com versões anteriores do ASCII. Instantaneamente qualquer sistema ASCII de 7 bits se tornou instantaneamente um sistema básico UTF-8 (embora não necessariamente manipule mais do que os 127 caracteres do ASCII básico).

O UTF-8 expande o sistema ASCII permitindo que vários bytes sejam reunidos para formar um único caractere. Isso permite que os computadores lidem com muitas centenas de milhares de caracteres diferentes - o objetivo é poder ter todos os caracteres de todos os alfabetos de todas as linguagens juntos em uma grande tabela de caracteres.

link explica como tudo funciona em detalhes.

    
por 08.03.2011 / 19:03