Unicode é um padrão para codificar texto simples . Assim, qualquer símbolo usado em textos matemáticos é um candidato à codificação como um caractere Unicode, e um número muito grande desses caracteres foi codificado. O processo está em andamento e novos caracteres serão adicionados se forem realmente levados para o usuário.
Sobrescrever e subscrever é como tal, não texto simples, mas “rich text”, assim como itálico, negrito, fontes específicas, cores, planos de fundo, bordas e letras animadas são. Um sobrescrito "2" ainda é o caractere "2", apenas em uma posição elevada e geralmente em tamanho menor. Dessa perspectiva, poderíamos dizer que sobrescritos e subscritos não precisam ser codificados. Caracteres normais podem ser usados, e dispositivos além do nível de texto simples, ou “protocolos de nível superior” podem ser usados, como comandos em um processador de texto, configurações de estilo, marcação HTML ou MathML, etc.
Portanto, a questão é realmente por que os sobrescritos e os subscritos foram incluídos no Unicode, e não porque eles não constituem um conjunto uniforme. Uma razão é que outros códigos de caracteres têm caracteres sobrescritos e subscritos. Unicode tem que incluí-los. Outra razão é dada na nota Unicode em XML e outras linguagens de marcação : “Letras e dígitos super e subscritos são É bastante comum em algumas formas de transcrições fonéticas ou fonêmicas, em que o uso de estilos é inadequado e propenso a problemas de integridade de dados quando exportado para texto simples. Para letras super ou subscritas em transcrição fonética em particular, uma mudança de sobrescrito de subscrito para estilo regular alteraria o significado. Observe que esse uso na transcrição não se limita a letras: os dígitos pequenos sobrescritos costumam ser usados para indicar tom. Quando usados para esses propósitos, esses caracteres devem ser retidos e a marcação não deve ser usada. ”
No entanto, adicionar versão sobrescrita e subscrita de qualquer personagem significaria adicionar cerca de 200.000 caracteres. Em seguida, alguém gostaria de ter versões em itálico e negrito de qualquer caractere, e assim por diante, e ficaríamos sem espaço de codificação. Antes disso, os tipógrafos teriam falhas nervosas: eles realmente não querem criar glifos para esses caracteres (a maioria nunca seria usada).
É por isso que o documento citado acrescenta: “Quando usado em contexto matemático (MathML), recomenda-se usar consistentemente marcação de estilo para sobrescritos e subscritos. Isso ocorre porque o layout matemático permite não apenas símbolos individuais, mas expressões inteiras são sobrescritas ou subscritas de maneira aninhada e regular. ”