No geral, o Firefox renderiza todos os caracteres Unicode nos quais ele não pode encontrar um glifo em suas fontes, como uma caixa contendo o código do caractere. Se você vai para por exemplo. um site chinês e você não tem fontes chinesas instaladas, você não terá nada além de pequenas caixas.
No entanto, esse caractere específico na captura de tela é CH U + FFFD REPLACEMENT CHARACTER. (Eu recebo uma forma de diamante com um ponto de interrogação; você também pode obter uma caixa quadrada ou apenas um ponto de interrogação.)
A menos que alguém tenha digitado esse caractere deliberadamente, o que é improvável (exceto por eu fazer isso acima), U + FFFD significa que alguém errou suas codificações em algum ponto ao longo da linha e também:
-
tentou codificar um caractere em uma codificação que não o suporta, por exemplo, se alguém tentou enviar um caractere chinês em uma codificação Latin-1 ou
-
serviu uma sequência de bytes codificados como UTF-8 quando na verdade é outra coisa.
Na captura de tela específica, é claramente um problema em que as "citações inteligentes" foram enviadas como uma única página de códigos do Windows de 1252 bytes. Então os dados provavelmente foram erroneamente atribuídos como UTF-8.
Quando a atribuição incorreta é devida ao seu navegador adivinhando o conjunto de caracteres incorreto (para páginas estúpidas que não identificam seus conjuntos de caracteres), você pode corrigi-lo indo em Visualizar- > Codificando e adivinhando o caminho certo. Onde a atribuição incorreta é devida ao processamento de strings pelo próprio site, não há muito o que fazer sobre isso. Infelizmente, muitos sites da web têm charsets errados, particularmente aqueles escritos em linguagens ignorantes do Unicode como PHP, ASP clássico, Ruby e JSP (apesar das strings nativas do Java, o JSP / Servlet é bastante corrompido).