Eu preciso converter arquivos PowerPoint PPTX em HTML usando a linha de comando. O arquivo HTML deve preservar o texto como texto (não imagem) ao converter todas as formas, artes inteligentes e gráficos em imagens (ou, se não, imagens, em seguida, SVG).
Estou tentando fazer isso usando o LibreOffice Impress 4.4.3.2.
Se eu abrir o Impress e exportar um arquivo PPTX para HTML, todos os slides serão convertidos em imagens, incluindo o texto. Se eu exportar para PDF, ele realmente preserva texto e converte todas as formas bem, mas, infelizmente ... Eu quero HTML não PDF.
Usando a linha de comando (no Windows 8), tentei todos os filtros HTML que encontrei: link text
A maioria deles simplesmente não funcionou. O mais perto que pude encontrar:
soffice.exe --headless --convert-to html --outdir d: \ temp d: \ temp \ presentation.pptx converteu o texto bem, mas por algum motivo todas as formas e gráficos estão faltando no arquivo HTML convertido.
Como posso resolver meu problema? Talvez algumas outras bibliotecas de ferramentas / .net gratuitas possam fazer isso?