Como obter apenas o conteúdo para a página da web que eu vejo no navegador ... Eu não quero os cabeçalhos e qualquer tag HTML .. exp- link .. Eu quero apenas o conteúdo .. Por favor ajude

por Arun 21.08.2017 / 02:57

Se você quiser apenas despejar a página em formato imprimível, isso é possível com um navegador de texto (como lynx, w3m, elinks). Aqueles têm uma opção "-dump".

Aqui está o início dessa página com "lynx -dump" :


                               The cat Command

   cat is one of the most frequently used [2]commands on [3]Unix-like
   [4]operating systems. It has three related functions with regard to
   text files: displaying them, combining copies of them and creating new

   cat's general syntax is

     cat [options] [filenames] [-] [filenames]

   The square brackets indicate that the enclosed items are optional.
