Para realmente explicar a questão que mencionamos: O que você está vendo aqui é a substituição de fontes feita pelo Windows. Se o texto a ser exibido não contiver um caractere na fonte selecionada, o Windows tentará encontrar um no local em que ele existe. Isso é mais útil para ter execuções de, digamos, chinês ou árabe em meio ao texto em latim, porque o Windows tem fontes especiais para determinados scripts e nenhuma fonte pode conter todos os scripts de qualquer maneira¹.
Uwe menciona a marca de ordem de byte, embora não precise aparecer em sua encarnação UTF-8. Por exemplo. em um arquivo de texto UTF-16 parece diferente. Normalmente, o U + FEFF não deve aparecer no meio de um fluxo de texto, mas sim apenas no início, mas é apenas um espaço de largura zero, portanto, normalmente não há nenhum dano se ocorrer ocasionalmente. Mas o Bloco de Notas aqui apenas encontra um caractere que a fonte selecionada não possui². Então, outro é encontrado e contém uma vez que os caracteres em torno dele se encaixam bem na fonte então selecionada, tem um certo contágio.
Este caso aqui é divertido porque o personagem não é sequer visível, mas muitas vezes você tem um fenômeno semelhante em que apenas um único caractere é renderizado em outra fonte:
Naturalmente, nesses casos, é bem fácil perceber porquê.
1 Limitações de formato de fonte para um, e então o problema usual de como os estilos de fonte latinos (por exemplo, serif, sans-serif, handwritten, etc.) são mapeados para o respectivo script - geralmente é inútil tentar com a maioria das fontes . Portanto, a maioria das fontes contém pelo menos latim, grego e cirílico, porque elas são muito semelhantes em estilo, mas além disso raramente é feito.
2 Como observado, como o caracter geralmente só aparece no início de um fluxo de texto e é removido (porque não é considerado parte do conteúdo), uma fonte não precisa ter um glifo para ele. / p>