Como é http: //d§.cc/ um URL válido?

2

Enquanto navegava on-line hoje, encontrei o seguinte URL:

http://d§.cc/

De alguma forma funciona. No Firefox 3.6 / Mac, o navegador parece interpretar o URL como:

http://xn--d-jca.cc/

No Safari 5 / Mac, o URL não muda quando eu navego para ele.

Eu sempre entendi que o caractere § ( sinal da seção ), entre outros, é inválido em URLs. Para citar RFC 1738 :

Thus, only alphanumerics, the special characters "$-_.+!*'(),", and reserved characters used for their reserved purposes may be used unencoded within a URL.

Isto é uma estranheza na codificação de caracteres? E como / onde posso registrar minha própria URL?

    
por Bungle 30.06.2010 / 00:32

2 respostas

12

Este é um nome de domínio internacionalizado ou IDN. A codificação usada é chamada punycode .

Muitos grandes registradores estão no negócio de vender nomes de domínios IDN, incluindo o GoDaddy, mas quando eu registrei meu IDN de vaidade (ə.tv) achei o Name.com mais fácil. Eles custam o mesmo que os domínios "regulares".

Aqui está uma lista de caracteres IDN válidos - tenha em mente, no entanto, que muitos desses personagens ganharam é exibido corretamente em todas as fontes, portanto, se você estiver no mercado para um IDN, certifique-se de testá-lo em fontes comumente usadas nas plataformas de destino antes de fazer uma compra.

    
por 30.06.2010 / 00:34
1

Isso é chamado de IDN (nome de domínio internacionalizado). Não tem nada a ver com URIs, é um recurso do DNS (Domain Name System) que resolve nomes DNS legíveis por humanos como www.example.com em endereços IP, como 127.0.0.1 .

Como originalmente o Sistema de Nomes de Domínio era apenas ASCII, o IDN era introduzido de maneira compatível com versões anteriores: Os nomes DNS que contêm caracteres não ASCII são codificados em nomes DNS que contêm apenas caracteres ASCII usando um algoritmo chamado Punycode, que é especificamente projetado para ser eficiente para os tipos de strings que normalmente estão contidos em um nome DNS e ainda assim podem ser de algum modo legíveis, mesmo na forma codificada.

O principal objetivo do IDN é, como o nome indica, possibilitar o registro de nomes de domínio em outros idiomas além do inglês. No entanto, um efeito colateral é que agora todos os caracteres Unicode, incluindo símbolos que realmente não têm nada a ver com idiomas não ingleses, podem ser usados em nomes de domínio.

    
por 30.06.2010 / 00:43