Por que os caracteres (russos) de alguns e-mails recebidos são alterados durante a leitura no David InfoCenter?

3

Estou usando o David InfoCenter como software de e-mail e tenho problemas com alguns dos meus e-mails em russo. São apenas algumas letras, em alguns e-mails (enviados de pessoas diferentes), como por exemplo o "R" ("Р" em russo) será mostrado como "Т". Em outros emails em russo, o problema não aparece. Não é estranho? Alguém já teve o mesmo problema e descobriu o que o causa?

Quando eu transmito esse e-mail para uma caixa de correio externa (conta de e-mail da internet), é ainda pior e me dá símbolos em vez de todas as letras russas.

A codificação padrão era "Russian (ISO)", eu mudei para "Russian (Windows)", mas o mesmo problema. Outra reação estranha é quando eu escrevo um e-mail interno e o nomeio "Test" em russo (Тест), com Тест na janela de texto, ele muda o título para "Oano"? Mas o conteúdo fica em russo.

Com o Mailinator, recebi o seguinte, para mensagem e assunto "Тест":

Subject: ????
[..]
MIME-Version: 1.0
Content-Type: multipart/alternative;
boundary="----_=_NextPart_000_00017783.4AF7FB71"
This message is in MIME format. Since your mail reader does not understand
this format, some or all of this message may not be legible.
------_=_NextPart_000_00017783.4AF7FB71
Content-Type: text/plain;
charset="utf-8"
Content-Transfer-Encoding: base64
0KLQtdGB0YI=
------_=_NextPart_000_00017783.4AF7FB71
Content-Type: text/html;
charset="utf-8"
Content-Transfer-Encoding: base64
PCFET0NUWVBFIEhUTUwgUFVCTElDICItLy9XM0MvL0RURCBIVE1MIDQuMCBUcmFuc2l0aW9uYWwv
L0VOIj4NCjxIVE1MPjxIRUFEPg0KPE1FVEEgaHR0cC1lcXVpdj1Db250ZW50LVR5cGUgY29udGVu
dD0idGV4dC9odG1sOyBjaGFyc2V0PXV0Zi04Ij4NCjxNRVRBIG5hbWU9R0VORVJBVE9SIGNvbnRl
bnQ9Ik1TSFRNTCA4LjAwLjYwMDEuMTg4NTIiPjwvSEVBRD4NCjxCT0RZIHN0eWxlPSJGT05UOiAx
MHB0IENvdXJpZXIgTmV3OyBDT0xPUjogIzAwMDAwMCIgbGVmdE1hcmdpbj01IHRvcE1hcmdpbj01
Pg0KPERJViBzdHlsZT0iRk9OVDogMTBwdCBDb3VyaWVyIE5ldzsgQ09MT1I6ICMwMDAwMDAiPtCi
0LXRgdGCPFNQQU4gDQppZD10b2JpdF9ibG9ja3F1b3RlPjxTUEFOIGlkPXRvYml0X2Jsb2NrcXVv
dGU+PC9ESVY+PC9TUEFOPjwvU1BBTj48L0JPRFk+PC9IVE1MPg==
------_=_NextPart_000_00017783.4AF7FB71--
    
por waszkiewicz 05.11.2009 / 10:52

2 respostas

5

Para detalhar a mensagem:

Subject: ????

Que pena, o seu David InfoCenter não está fazendo as coisas direito. O acima deveria ter sido algo como:

Subject: =?utf-8?Q?=D0=A2=D0=B5=D1=81=D1=82?=

Então, esse é um bug que deve ser informado e corrigido.

Próximo:

MIME-Version: 1.0
Content-Type: multipart/alternative;
 boundary="----_=_NextPart_000_00017783.4AF7FB71"

O texto acima diz ao destinatário que após cada linha "----_ = _ NextPart_000_00017783.4AF7FB71" encontrará a mesma mensagem em um formato diferente. Bom.

Próximo:

This message is in MIME format. Since your mail reader does not understand
this format, some or all of this message may not be legible.

As informações acima serão visíveis para usuários de softwares de e-mail antigos que não entendem o MIME. Bom.

Próximo:

------_=_NextPart_000_00017783.4AF7FB71
Content-Type: text/plain;
 charset="utf-8"
Content-Transfer-Encoding: base64
0KLQtdGB0YI=

O texto acima é simples, sem negrito, itálico, etc. Usando o grande Decodificador Online Base64 do FileFormat.info, o 0KLQtdGB0YI= traduz de volta para Тест . Aha, não o minúsculo тест como você escreveu ...? De qualquer forma, parece bom, e um bom cliente de e-mail deve entender essa parte.

Mais detalhadamente: 0KLQtdGB0YI= realmente decodifica para hexadecimal d0 a2 d0 b5 d1 81 d1 82 e você (deve) ver os mesmos números hexadecimais no Assunto acima. (Quando não decodificado corretamente como sendo UTF-8, como quando erroneamente interpretado como Windows-1252, isso seria mostrado como ТеÑÑ‚ .)

Próximo:

------_=_NextPart_000_00017783.4AF7FB71
Content-Type: text/html;
 charset="utf-8"
Content-Transfer-Encoding: base64
PCFET0NUWVBFIEhUTUwgUFVCTElDICItLy9XM0MvL0RURCBIVE1MIDQuMCBUcmFuc2l0aW9uYWwv
L0VOIj4NCjxIVE1MPjxIRUFEPg0KPE1FVEEgaHR0cC1lcXVpdj1Db250ZW50LVR5cGUgY29udGVu
dD0idGV4dC9odG1sOyBjaGFyc2V0PXV0Zi04Ij4NCjxNRVRBIG5hbWU9R0VORVJBVE9SIGNvbnRl
bnQ9Ik1TSFRNTCA4LjAwLjYwMDEuMTg4NTIiPjwvSEVBRD4NCjxCT0RZIHN0eWxlPSJGT05UOiAx
MHB0IENvdXJpZXIgTmV3OyBDT0xPUjogIzAwMDAwMCIgbGVmdE1hcmdpbj01IHRvcE1hcmdpbj01
Pg0KPERJViBzdHlsZT0iRk9OVDogMTBwdCBDb3VyaWVyIE5ldzsgQ09MT1I6ICMwMDAwMDAiPtCi
0LXRgdGCPFNQQU4gDQppZD10b2JpdF9ibG9ja3F1b3RlPjxTUEFOIGlkPXRvYml0X2Jsb2NrcXVv
dGU+PC9ESVY+PC9TUEFOPjwvU1BBTj48L0JPRFk+PC9IVE1MPg==

O acima é o mesmo, como uma mensagem formatada em HTML. Isso parecerá o mesmo, embora isso não seja HTML válido, já que as tags não são fechadas na ordem em que são abertas e um id deve ser exclusivo, mas id=tobit_blockquote é usado duas vezes nessa linha mensagem. Na verdade, a palavra "blockquote" sugere que você possa ter copiado a palavra Тест de outra mensagem?

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML><HEAD>
<META http-equiv=Content-Type content="text/html; charset=utf-8">
<META name=GENERATOR content="MSHTML 8.00.6001.18852"></HEAD>
<BODY style="FONT: 10pt Courier New; COLOR: #000000" leftMargin=5 topMargin=5>
<DIV style="FONT: 10pt Courier New; COLOR: #000000">Тест<SPAN 
id=tobit_blockquote><SPAN id=tobit_blockquote></DIV></SPAN></SPAN>
</BODY></HTML>

Além disso, não é necessário enviar HTML para mensagens simples ...

Finalmente (observe os dois traços à direita):

------_=_NextPart_000_00017783.4AF7FB71--

Isso informa ao software de e-mail que o fim de todos os formatos foi atingido.

Esta mensagem de teste não explica como o Тест pode se tornar Oano , pois os pontos de interrogação nunca poderiam ser traduzidos para isso. Talvez os pontos de interrogação não sejam pontos de interrogação reais, afinal. De qualquer forma: o assunto estar errado é um bug no seu cliente de e-mail, que não envia o assunto correto. Além disso, o HTML é buggy. Pare de usar esse software.

    
por 09.11.2009 / 12:24
2

Certamente deve ser um conjunto de caracteres e / ou um problema de codificação. Hoje em dia, todos os diferentes conjuntos de caracteres, como "Russo (ISO)" e "Russo (Windows)", não devem mais ser necessários ao usar o Unicode. E quando usando Unicode, a maioria das mensagens será codificada usando UTF-8.

Então:

  • A alteração do conjunto de caracteres para ajuda Unicode?
  • A alteração da codificação para UTF-8 ajuda?
  • Se não: você pode postar a fonte da mensagem de teste depois de recebê-la? (Tenha o cuidado de substituir qualquer endereço de e-mail por algo como [email protected] antes de adicioná-lo à sua pergunta.)

Todos os clientes de email têm uma maneira diferente de mostrar a verdadeira fonte, por isso talvez usar algum serviço online seja a maneira mais fácil de explicar como ver o que é recebido:

  • Envie uma mensagem de teste para alguma conta do Mailinator. Não é necessário criar uma conta: tudo o que você colocar antes de @mailinator.com funcionará, mas observe que qualquer um que adivinhar esse endereço pode ler a Caixa de entrada.
  • Acesse sua caixa de entrada em mailinator.com
  • Clique no assunto para abrir a mensagem
  • Ao visualizar a mensagem, clique no link "(visualização de texto)":

  • Issomostraráalgocomo:

    Received:from[..]by[..]for&lt;[email protected]&gt;;Fri,6Nov200911:58:10+0100(CET)Subject:=?utf-8?Q?Test_/_=D1=82=D0=B5=D1=81=D1=82?=From:Arjan&lt;[..]&gt;Content-Type:text/plain;charset=utf-8;format=flowedMessage-Id:[..]Date:Fri,6Nov200911:58:08+0100To:[email protected]:quoted-printableMime-Version:1.0(AppleMessageframeworkv1076)X-Mailer:AppleMail(2.1076)X-Virus-Scanned:byXS4ALLVirusScannerAtest/=D1=82=D0=B5=D1=81=D1=82forSuperUser.Gr=C3=BC=C3=9Fen!Arjan.=.

Acima,algunsdetalhespessoaisforamremovidos:nãoénecessárionosmostrarseuendereçodee-mailoudetalhesdoservidor(comoendereçosIP).

(Poralgumarazão,oMailinatormostraafontecodificadaemUTF-8damensagem"A test / test para Super User. Grüßen!" como ASCII na captura de tela acima. Ver coisas como ¼ para ü e Ãe para ß é tipicamente texto codificado em UTF-8 que ainda não foi decodificado, mas o assunto é um sobra das comunicações SMTP, e poderia ter sido removido pelo Mailinator.

    
por 05.11.2009 / 12:20