Os conjuntos de dados públicos não estão hospedados no Amazon S3 , sendo fornecidos como Instantâneos do Amazon Elastic Block Store (EBS) . Embora eles sejam armazenados no S3, na verdade, não é possível acessar um snapshot diretamente, em vez disso, é necessário criar um novo Volume do EBS e anexá-lo a uma instância do Amazon EC2 para processamento posterior a seu critério .
Navegar no conjunto de dados é um caso de uso razoável, claro, mas infelizmente você não pode evitar usar uma instância do EC2 e um volume do EBS - veja a seção Como funciona para detalhes:
Select public data sets are hosted on Amazon EC2 for free as Amazon Elastic Block Store (Amazon EBS) snapshots. Amazon EC2 customers can access this data by creating their own personal Amazon EBS volumes, using the public data set snapshots as a starting point. They can then access, modify and perform computation on these volumes directly using their Amazon EC2 instances [...]
To get started using the Public Data Sets on AWS, simply perform these three easy steps:
- Sign up for an Amazon EC2 account.
- Launch an Amazon EC2 instance.
- Create an Amazon EBS volume using the Snapshot ID listed in the catalog above for your chosen snapshot.
Como essas etapas são executadas em detalhes é explicado na documentação que você já vinculou, ou seja, Iniciando uma instância e Criando um volume de conjunto de dados públicos .
Depois de disponibilizá-lo, você pode armazenar o conjunto de dados em um intervalo S3 claro.