O problema parece ser pelo menos duplo:
- As respostas do WHOIS não compartilham um esquema comum e
- há uma escassez de clientes WHOIS capazes de analisar respostas WHOIS e mapear seus campos (por exemplo, usando uma ontologia adequada) em um único esquema. O projeto Ruby Whois é o esforço mais extenso que encontrei. Ele visa fornecer um analisador para cada um dos mais de 500 servidores WHOIS , e seus desenvolvedores merecem crédito imenso, mas continua sendo um trabalho em andamento.
Este é um estado lastimável de coisas.
A solução proposta da IETF para esse e outros problemas do WHOIS é chamada de Protocolo de Acesso a Dados de Registro (RDAP) .
Citando RFC 7485 , que explica a justificativa para o RDAP:
In the domain name space, there were over 200 country code
Top-Level Domains (ccTLDs) and over 400 generic Top-Level Domains
(gTLDs) when this document was published. Different Domain Name
Registries may have different WHOIS response objects and formats. A
common understanding of all these data formats was critical to
construct a single data model for each object.
(ênfase minha)
Infelizmente, enquanto a maioria dos registros de TLDs fornece servidores WHOIS para seus subdomínios, apenas um Até agora, dois registros de TLDs enviaram formalmente servidores RDAP para seus subdomínios : CZNIC para domínios .cz e NIC Argentina para domínios .ar. Então, isso não é (ainda) uma solução geralmente aplicável em uma ampla gama de TLDs. Só podemos esperar que todos os outros registros se apressem e trabalhem com servidores RDAP.
Quanto ao software, o único cliente de linha de comando RDAP para sistemas POSIX que encontrei até agora é nicinfo
.