Para começar com noções básicas, tudo é baseado em US-ASCII, que é um código de 7 bits com 128 pontos de código no conjunto, numerados hex 00 a 7F ou 0-127 decimal. Isso é mapeado para códigos de controle, alfanuméricos em inglês e caracteres de pontuação básicos
Adicionando 1 bit a isto para um código de 8 bits (byte) nos dá outros 128 pontos de código ou Extended ASCII.
Conjuntos de caracteres / páginas de códigos foram necessários no início para alterar a forma como o código aponta nos 128 bits superiores mapeados para caracteres para cobrir o alfabeto do idioma específico que você deseja representar. Isso funciona razoavelmente bem para a maioria dos idiomas europeus ocidentais. A ISO 8859-1 / Latin-1 é um exemplo de tal conjunto de caracteres. Outro é o Windows-1252, que tem alterações da ISO 8859-1 para ajudar a cobrir mais ou diferentes caracteres.
Idiomas com conjuntos de caracteres mais complexos, como chinês, japonês e coreano, excedem os recursos do conjunto de 256 pontos de código e usam um código de dois bytes para permitir sua representação.
O Unicode UTF-8 é um esquema de codificação de caracteres de múltiplos bytes (de 1 a 4 bytes) com compatibilidade retroativa com a ISO 8859-1 / Latin-1, sendo seus primeiros 128 caracteres. Ele tem espaço para mais de 1 milhão de pontos de código, o que significa que cada ponto de código pode realmente representar um caractere, diferente do mapeamento feito com Extended ASCII, o que significa que um ponto de código é mapeado para um caractere diferente, dependendo do conjunto de caracteres / página de códigos / codificação.
Fontes são glifos que são mapeados para pontos de código e representam visualmente caracteres. O conteúdo de uma fonte depende de quais idiomas ela deveria cobrir originalmente. Você pode usar o Mapa de caracteres para ver quais glifos estão contidos na fonte.
Fontes Unicode não cobrem necessariamente todos os pontos de código, você precisa ver onde elas deveriam ser usadas. Por exemplo, no Windows 7, abra Mapa de Caracteres e veja os caracteres em Calibri e compare-os com Ebrima, Meiryo e Raavi. Note que eles são muito diferentes porque cada um é adaptado para uma região geográfica diferente.
Quanto às fontes Unicode e ao conjunto de caracteres Windows-1252, o Windows usa uma tabela de mapeamento para converter o Windows-1252 para Unicode, onde não corresponde à ISO 8859-1 para um cenário "Melhor ajuste" onde alguns caracteres no Windows -1252 conjunto de caracteres pode não ser exibido.