Faça o pandoc ignorar a classe de estilo css

1

Estou tentando converter um arquivo HTML para o Markdown usando o Pandoc, mas estou tendo dificuldades em encontrar as opções corretas.

Eu gostaria de converter todo o arquivo HTML para o Markdown mais simples possível. Ou seja, nenhuma tag <div> e nenhum estilo CSS entre chaves. No entanto, quando eu insiro o seguinte HTML para pandoc chamando pandoc -f html -t markdown reduced.html -o res.md :

<div class="section-content">
<div class="section-inner sectionLayout--insetColumn">
    <h3 name="2ee9" id="2ee9" class="graf graf--h3 graf--leading graf--title">Post Title</h3>
    <p name="021f" id="021f" class="graf graf--p graf-after--h3">Preamble <a href="https://cogsci.stackexchange.com/users/4397/seanny123?tab=questions" data-href="https://cogsci.stackexchange.com/users/4397/seanny123?tab=questions" class="markup--anchor markup--p-anchor" rel="noopener" target="_blank">link</a> and conclusion.</p>
</div>

Eu recebo a seguinte saída do Markdown com todas as coisas que gostaria de ignorar:

<div class="section-content">

<div class="section-inner sectionLayout--insetColumn">

### Post Title {#2ee9 .graf .graf--h3 .graf--leading .graf--title name="2ee9"}

Preamble
[link](https://cogsci.stackexchange.com/users/4397/seanny123?tab=questions){.markup--anchor
.markup--p-anchor} and conclusion.

</div>

</div>

Eu tentei ler os documentos do Pandoc Markdown, mas não consegui encontrar nenhuma indicação de quais parâmetros eu deveria estar usando.

    
por Seanny123 23.10.2017 / 03:57

1 resposta

3

Se você usa pandoc -f html -t markdown_github-raw_html reduced.html -o res.md , resolve o problema.

  • markdown_github reduz o conjunto de saídas para ignorar o CSS

  • -raw_html remove a extensão raw_html , que corrige os links

por 23.10.2017 / 04:06