Formatação de codificação de caracteres de correio

0

De vez em quando, recebo um email que não está formatado corretamente, pois contém muitos caracteres '= 92' e '=':

We are looking for candidates to join our team.    Great qualifications inc=
lude:

*     PhD or Masters specializing in Machine Learning, Statistics, or related fi=
elds.

=B7     Experience dealing with large, real-life data sets. (not just pre-c=
anned problems).

Por que isso ocorreria? Um cliente de email de remetente com bugs? Codificação MIME errada?

    
por notnoop 06.10.2009 / 15:55

1 resposta

2

O problema talvez seja dividido entre os programas de envio e recebimento de email.
É certo que o remetente do email não viu tal bagunça quando ele enviou seu email. O problema está relacionado a como a codificação real usada pelo remetente é declarada na parte de cabeçalhos do email.

O problema básico é que existem muitos caracteres para todos serem expressos usando apenas o simples conjunto de caracteres latinos ascii. A solução final deve ser Unicode , cujo propósito declarado é conter todos os conjuntos de caracteres do mundo (o que já é impossível) . Existem também soluções intermediárias, como quoted-printable , que é provavelmente o que vemos em sua pergunta.

Agora, para cada conjunto de caracteres (exceto possivelmente Unicode), há várias implementações independentes por cada cliente de email, às quais você também adiciona a implementação dos cabeçalhos de email.

O resultado é que ver exatamente a mesma representação do texto do email é garantida apenas se o mesmo software cliente de email for usado tanto para o remetente quanto para o destinatário. Especialmente a culpa é o Outlook, que não respeita muito os padrões internacionais e, portanto, é capaz de gerar e-mails que outros clientes possam ter dificuldades em exibir de maneira idêntica.

Para essa confusão, você deve adicionar o fato de que diferentes sistemas operacionais podem fornecer valores numéricos diferentes para os mesmos caracteres. Por exemplo, entre o Mac e o PC, não há um acordo sobre o valor numérico de um único caractere acentuado.

Este artigo também será interessante para você: Codificação de caracteres em e-mail: tendo que lidar com a porcaria do GroupWise em 2004 , e pode mostrar problemas semelhantes que outras pessoas estão experimentando.

    
por 06.10.2009 / 16:25