Obter página em ondulação como texto

2

Existe alguma opção para curl que salva uma página como texto ?

Quero dizer, da mesma forma, uma página pode ser salva no navegador como Arquivos de texto . Pelo menos, o Firefox tem essa opção.

Eu preciso disso para um script, eu simplesmente faço algo como

curl -s http://... 

Mas isso tornaria as coisas muito mais fáceis de lidar com isso sem todo o código html.

Eu encontrei uma opção para lynx que faz o que eu quero: lynx -dump , mas eu prefiro usar curl .

Obrigado.

    
por Albert 15.01.2016 / 15:12

1 resposta

3

Não. Você pode usar lynx para isso:

lynx -dump URL

UPDATE. Ops. Desculpa. Eu não vi você saber sobre o lince.

Eu aconselho usar lynx para essa finalidade. Geralmente produz uma saída muito legível. Às vezes você deve usar a opção -width para aumentar a largura da saída.

    
por 15.01.2016 / 15:15

Tags