Este site usa muito javascript (jQuery).
Sugiro fazer o seguinte como um primeiro começo:
- Instalar o Firefox
- Instale o dados de violação addon
- Carregue o site, comece a adulterar
- Brinque com a ferramenta de consulta e dê uma olhada nos XMLHttpRequests gerados automaticamente (consulte Registros de dados de violação)
Talvez isso já seja suficiente para identificar as solicitações relevantes e como elas são criadas. Se isso não funcionar bem, você teria que ler as fontes javascript.
Como todas as solicitações são provavelmente apenas solicitações HTTP GET e HTTP POST com parâmetros específicos, você pode começar a automatizar, ex. com uma ferramenta como curl
. Além disso, scrapy
parece realmente promissor e parece trazer muitos recursos interessantes (mas não testei isso).
Em vez de usar o Firefox com o complemento de dados de Temper, você também pode usar qualquer outro navegador durante a captura do tráfego HTTP, por exemplo, com wireshark .