Extração de texto da página HTML

1

Estou usando o comando xidel para extrair texto da página HTML. Aqui está o meu código

  xidel  http://www.ip-adress.com/ip_tracer/8.8.8.8 --extract "<table>
  <tbody>
 <tr>
 <td>
 <table>
 <tbody>
  <tr> </tr>
 <template:loop>
  <tr> <th> {$field1} </th> <td> ${field2} </td> </tr>
  </template:loop>
  </tbody>
   </table>
   </td>
   <td> </td>
    </tr>
    </tbody>
     </table>
       " 

Eu usei o método de modelo. Quando eu corro este código. Eu não recebo erro nem qualquer saída no terminal. Isto é o que eu recebo depois de executar este código

    **** Retrieving (GET): http://www.ip-adress.com/ip_tracer/8.8.8.8 ****
    **** Processing: http://www.ip-adress.com/ip_tracer/8.8.8.8 ****
     ** Current variable state: **

e retorna o prompt $. Eu quero saber se a saída é armazenada em alguma variável?

    
por Swatesh Pakhare 25.10.2015 / 05:32

1 resposta

0

Os exemplos fornecidos para xidel mostram que ele é gravado na saída padrão. Se você deseja capturar essa informação, você deve redirecionar a saída padrão para um arquivo, ou para uma variável de shell você mesmo.

Por exemplo, o exemplo 10 faz isso para definir variáveis no bash:

eval "$(xidel http://site -e 'title:=//title' -e 'links:=//a/@href' --output-format bash)"

Há uma nota na parte inferior dos exemplos apontando para um arquivo leia-me para xidel (aparentemente a documentação como tal).

    
por 25.10.2015 / 11:38