Estou estudando aprendizado de máquina e a literatura é rica em fórmulas.
Eu quero poder extrair as fórmulas (que parecem ser criadas pelo TeX) para:
.PNG
images Eu tentei:
pdfimages
- apenas as imagens raster são extraídas (sem fórmulas) pdf2html -c
- as fórmulas são ilegíveis