Extrair valores do HTML via analisador HTML [duplicado]

1

Inicialmente perguntei sobre uma maneira de usar grep / awk diretamente de um arquivo HTML. Recebi alguns comentários, mas vejo que as pessoas não tinham todo o HTML e, portanto, as soluções sugeridas falharam.

Alguns mencionaram que a análise de HTML seria uma opção muito melhor. Como não tenho ideia, gostaria de perguntar aos especialistas aqui como isso funcionaria e, se possível, fornecer algumas informações. Eu trabalho em Raspberry Pi com o padrão Linux / Debian Wheezy.

O HTML mencionado é encontrado aqui, HTML simples ... mas eu acho importante ver o arquivo inteiro para ajudar:

link

Então, o que é necessário é:

  • Extraia os dois valores, Pplus e Pminus (18.0000 e 0.00000) e forneça-os, além de fornecer a soma.
  • Ambos os valores vêm de um medidor inteligente (medidor de energia) que fornece a energia gerada P e energia / energia extraída da rede P +.
  • P- no caso de sol e usina solar funcionando, então 18W é à noite, 0,0000 significa sem geração como sem sol, apenas para dar a você algumas informações básicas.

Eu tentei atualizar e pedir suporte no tópico original, mas parece que ninguém o viu novamente, já que não houve nenhum novo feedback nos últimos dias. Esta é a minha tentativa agora de trazer isso de volta aos especialistas aqui.

    
por njordan 23.06.2014 / 13:08

1 resposta

0

Olhando para este arquivo HTML de amostra:

<DIV ID="idButtonDiv" STYLE="top:143px; left:0px;" ALIGN="CENTER">
<TABLE CELLSPACING="0" CELLPADDING="0" BORDER="0"><TR><TD ID="idButtonTd">
18.000

</TD></TR></TABLE>
</DIV>

Não parece que isso seria facilmente analisável.

    
por 28.06.2014 / 21:03