Não sei. Qual é melhor: uma serra ou um martelo? : -)
Há um pouco no artigo que é um pouco mais relevante para o assunto em questão:
- O UTF-8 se concentra em minimizar o tamanho do byte para representação de caracteres do conjunto ASCII (representação de tamanho variável: cada caractere é representado em 1 a 4 bytes e caracteres ASCII cabem em 1 byte). Como Joel coloca:
“Look at all those zeros!” they said, since they were Americans and they were looking at English text which rarely used code points above U+00FF. Also they were liberal hippies in California who wanted to conserve (sneer). If they were Texans they wouldn’t have minded guzzling twice the number of bytes. But those Californian wimps couldn’t bear the idea of doubling the amount of storage it took for strings
-
O UTF-32 se concentra na exaustividade e na representação de comprimento fixo, usando 4 bytes para todos os caracteres. É a tradução mais direta, mapeando diretamente o ponto de código Unicode para 4 bytes. Obviamente, não é muito eficiente em termos de tamanho.
-
O UTF-16 é um compromisso, usando 2 bytes na maior parte do tempo, mas expandindo para 2 * 2 bytes por caractere para representar determinados caracteres, aqueles não incluídos no Plano Multilíngue Básico (BMP).