curl wget - Como ignorar a tag HTML e os cabeçalhos [duplicados]

0

Como obter apenas o conteúdo para a página da web que eu vejo no navegador ... Eu não quero os cabeçalhos e qualquer tag HTML .. exp- link .. Eu quero apenas o conteúdo .. Por favor ajude

    
por Arun 21.08.2017 / 02:57

1 resposta

1

Se você quiser apenas despejar a página em formato imprimível, isso é possível com um navegador de texto (como lynx, w3m, elinks). Aqueles têm uma opção "-dump".

Aqui está o início dessa página com "lynx -dump" :

   [1]LINFO

                               The cat Command

   cat is one of the most frequently used [2]commands on [3]Unix-like
   [4]operating systems. It has three related functions with regard to
   text files: displaying them, combining copies of them and creating new
   ones.

   cat's general syntax is

     cat [options] [filenames] [-] [filenames]

   The square brackets indicate that the enclosed items are optional.
    
por 21.08.2017 / 03:00

Tags