Tente:
unoconv -f txt -e FilterOptions=UTF8,LF Foo.docx
Parece um erro e foi reportado aqui .
Se isso não funcionar, talvez o seu LibreOffice não suporte o arquivo docx
. Veja mais detalhes aqui .
unoconv usa o LibreOffice para converter qualquer arquivo que o LibreOffice possa converter.
Agora preciso exportar para o texto com a codificação de caracteres UTF-8 .
Eu uso o seguinte comando:
unoconv -f txt -e FilterOptions=76 Foo.docx
Isso cria o arquivo Foo.txt
, mas sua codificação é us-ascii e os caracteres não são exibidos corretamente.
Se eu estiver certo, a opção -e
define as opções de filtragem de exportação como a página man men . O que há de errado com minhas opções?
Exemplo de arquivos de entrada e saída: