Como posso converter .odt para .html (ou .md) a partir da linha de comando?

2

Eu estou procurando por software livre que possa converter OpenDocument para HTML ou markdown.

Pandoc pode converter HTML para OpenDocument, mas não o contrário.

odt2html.py não pôde ser instalado usando pip e easy_install .

O LibreOffice pode fazer a conversão; no entanto, não consegui fazer isso funcionar com o seguinte comando:

soffice --convert-to --outdir . htm:HTML my.odt
    
por guaka 04.03.2015 / 14:22

1 resposta

3

Você está usando --convert-to , mas não está especificando o valor para isso.

A sintaxe correta é:

soffice --headless --convert-to htm:HTML --outdir . my.odt

Ou tente usar o seguinte script :

#! /bin/bash

CONFIG=/path/to/tidy_options.conf
# rm -rv "$2"
mkdir -p "$2"

for F in 'find $1 -type f -name "*.doc" -or -name "*.odt"'; do
  BASE='basename $F .doc' ; BASE='basename $BASE .odt'
  soffice --headless --convert-to htm:HTML --outdir $2 $F
  tidy -q -config $CONFIG -f $2/$BASE.err -i $2/$BASE.htm | sed 's/ class="c[0-9]*"//g' > $2/$BASE.html
done

Uso:

$ convert_doc_to_html.sh SOURCE_DIR TARGET_DIR

Veja:

por 04.03.2015 / 15:29