html2text é um script Python que converte uma página de HTML em texto estruturado equivalente a Markdown. O html2text pode ser baixado e executado em qualquer sistema operacional que tenha o Python instalado. O programa html2text está nos repositórios de muitas distribuições Linux e pode ser executado a partir da linha de comando assim:
html2text -style pretty input.html
Este comando não apenas converte o arquivo html original em texto, mas também faz um trabalho muito bom de facilitar a leitura da saída de texto simples. Os cabeçalhos se parecem com cabeçalhos, as listas parecem listas, etc.