A página foi escrita usando referências de entidade (termo antigo) ou referências de caracteres nomeados (termo HTML5), que são notações especiais para caracteres. Em uma página codificada em UTF-8, você pode usar, por exemplo, "Y" como tal, mas uma referência como ó
é válida também e pode ser preferida pelos autores / desenvolvedores da página por vários motivos (por exemplo, não saber como digitar "ó"). Muitas vezes, o uso de entidades é apenas um resquício de práticas antigas que antes eram necessárias (na década de 1990) antes do amplo apoio ao UTF-8 em navegadores.
A notação ó
é completamente segura de usar, embora torne o código-fonte HTML menos legível. Por exemplo, se um usuário copia e cola o texto, ele obtém “o”, porque ó
existe apenas na fonte HTML; ele é convertido internamente para “o” pelo analisador de HTML de um navegador.
No entanto, algumas algumas referências não são seguras. Geralmente, as entidades definidas no HTML 4.01 são seguras. (Alguns deles podem se referir a caracteres que nem sempre são processados corretamente devido a problemas de fonte, mas esses problemas existem independentemente do uso de uma entidade versus o próprio caractere.) Há um conjunto muito maior de nomeou referências de caracteres em HTML5 e as versões antigas de navegadores geralmente não têm suporte para as extensões.
Por exemplo, ō
pode ou não ser suportado. Se suportado, é mostrado como “ō” (o com macron); se não for suportado (por exemplo, no IE 9 e anterior), será processado literalmente. Portanto, é muito mais seguro usar o próprio caractere ou o numérico referece ō
.