usando wget para preencher um formulário de página da Web

0

Estou tentando usar o wget para fazer o download dos 100 últimos históricos de jogos do keno do site da loteria do MO .

Intervalo de amostra - > 1420698-1420797

A página da web requer a inserção de um intervalo e o clique em um botão. Eu estou tentando automatizar o processo, mas não tendo muito sucesso. Abaixo está uma lista dos valores que eu tirei da página vinculada acima.

<form name="winnersForm">
  <input type="text" name="drawnumber" size="8" value=""/>
  <input type="submit" value="Display Winning Number" onClick="window.open('../club_keno/club_keno_drawings.html')/>

Não tenho certeza se o wget pode fazer esse tipo de coisa, pois pode exigir algum código java como um número de identificação de sessão. Eu tentei analisar tudo em uma única string, em seguida, use o comando shell para executá-lo, mas não obter nada, mas a página principal do meu download, sem números. Eu li o manual e procurei por exemplos, mas não consigo encontrar nada para o que estou tentando fazer. Eu escrevi um programa que tira todas as tags e formata os dados em um arquivo de texto que eu uso para outros jogos.

Qualquer ajuda seria muito apreciada.

    
por dummy-1 09.07.2016 / 11:14

1 resposta

0

O servidor não parece realmente fazer nenhuma verificação ou validação de sessão e eu consigo obter todos os números.

Do seu navegador, copy as cURL (consulte aqui ). Remova cabeçalhos estranhos e adicione filtragem.

Acabei com:

curl 'http://www.molottery.com/gameHistory.do?method=ckDisplay&cmt=true' -H 'Accept-Encoding: gzip, deflate' -H 'Accept-Language: en-US,en;q=0.8' -H 'Content-Type: application/x-www-form-urlencoded' -H 'Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8' --data 'drawnumber=1420698-1420797' --compressed | grep td

que resulta em:

                    --------
                    -----------
                 <td align="center">52</td><td align="center">44</td><td align="center">10 - 14 - 20 - 21 - 24 - 27 - 28 - 32 - 33 - 39 -
                            41 - 42 - 44 - 45 - 46 - 48 - 52 - 57 - 58 - 72</td>
                            <td align="center">1</td>
                            <td align="center"> $1,077</td><td align="center"> $5,966</td><td align="center"> $15,210</td></tr>
                    <td>1420789</td>
                    <td>07-06-16</td>
                    --------
                    -----

Agora, tudo que o seu script precisa fazer é atualizar drawnumber na solicitação.

Eu não tentei com o wget, mas o processo deve funcionar bem.

    
por 10.07.2016 / 16:20

Tags