Existem scripts para o html2text, mas acho que o que você está procurando é xpath (por exemplo, xmllint suporta) para obter o conteúdo de alguns elementos da sua página html.
Eu estou procurando uma maneira de extrair o texto completo de um arquivo html na linha de comando. O objetivo disso é criar um bloco para minha barra de status do i3.
Encontrei algum site com nomes como "Texto completo RSS", mas sempre produz um pequeno html ...
Tags scripting rss-aggregator