Por que a letra cirílica no domínio da URL parece tão estranha?

6

Uma breve explicação:

Por que caracteres russos no nome de domínio na URL перезагрузкаопмо.рф são mapeados para alguma aleatoriedade como esta: http://xn--80aaigamcyttbbjfe2c.xn--p1ai . Por favor note, eu não estou falando sobre o assunto com decoing em URL como este: http://ru.wikipedia.org/wiki/%D0%97%D0%B0%D0%B3%D0%BB%D0%B0%D0%B2%D0%BD%D0%B0%D1%8F_%D1%81%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86%D0%B0

Longa explicação:

Eu estava pesquisando na lista de sites que tem problemas com a recente exploração heartbleed, e o site com um estranho nome de domínio surpreendeu eu: http://xn--80aaigamcyttbbjfe2c.xn--p1ai/ . Em qualquer outro caso, eu diria que este é o tipo de site porn / viagra / exploit / dyingNigerianPriceSendingMoney (baseado em seu nome enigmático), mas a classificação global de 46000 é impossível para esse tipo de coisa.

Olhando para o site, parece que está em russo, e com base na tradução do google - é sobre política. Mas quem irá a este site com tal URL? Quando investiguei um pouco mais, descobri que na verdade tem um URL normal como este ( перезагрузкаопмо.рф/‎ ). Mas quando eu insiro isso na minha barra de endereços, ele muda para o URL anterior.

Então, qual é o problema aqui? Por que перезагрузкаопмо.рф/ é mapeado para http://xn--80aaigamcyttbbjfe2c.xn--p1ai/ .

    
por Salvador Dali 19.04.2014 / 01:05

1 resposta

6

So what is the problem here? Why does перезагрузкаопмо.рф/‎ maps to http://xn--80aaigamcyttbbjfe2c.xn--p1ai/.

O DNS é antigo e, historicamente, suporta apenas os 26 caracteres latinos A a Z e o traço. Suponho que os projetistas originais do DNS não pensaram que duraria o suficiente para ser usado internacionalmente ou algo assim.

No entanto, é claro que a Internet é internacional, então os nomes de domínio também devem ser internacionais.

O link é na verdade um sistema de codificação chamado Punycode - é uma maneira de representar um nome de domínio com um conjunto de caracteres não-DNS dentro do conjunto de caracteres DNS. Esses domínios são chamados de Nomes de domínio internacionalizados (IDNs).

Os navegadores mais recentes exibirão IDNs no conjunto de caracteres nativo, se configurado para isso. O Punycode é o que é enviado para o servidor DNS nos bastidores. Você deve atualizar seu navegador ou verificar suas configurações se os IDNs não estiverem aparecendo no seu navegador.

Eu estava com essa impressão acima, mas depois de ler isso parece para proteger contra phishing de domínio usando caracteres semelhantes, são aplicados algoritmos ou whitelists para determinar quais IDNs são exibidos como caracteres nativos ou como o punycode.

Parte desse algoritmo para o Chrome é sua configuração atual de idioma.

Quando eu fui as configurações do Chrome, até as configurações de Idioma e Entrada, e adicionei russo e selecionei-o, o link apareceu como перезагрузкаопмо.рф no navegador.

    
por 19.04.2014 / 05:30

Tags