Eu tenho esta página . Desejo extrair texto da página html, particularmente cabeçalho da tabela ( th
) e dados da tabela ( td
). Por exemplo:
País: Estados Unidos (EUA) , Estado: Califórnia onde th
= País e td
= Estados Unidos (EUA).
Este é o mais próximo que consegui, usando xidel
:
xidel -A "Mozilla/5.0" http://www.ip-tracker.org/locator/ip-lookup.php ip=8.8.8.8 -e 'th[1] td[1]'
Como faço para extrair todas as entradas da tabela th
e td
na página html?