Convertendo documentos em texto com codificação UTF-8

2
O

unoconv usa o LibreOffice para converter qualquer arquivo que o LibreOffice possa converter.

Agora preciso exportar para o texto com a codificação de caracteres UTF-8 .

Eu uso o seguinte comando:

unoconv -f txt -e FilterOptions=76 Foo.docx

Isso cria o arquivo Foo.txt , mas sua codificação é us-ascii e os caracteres não são exibidos corretamente.

Se eu estiver certo, a opção -e define as opções de filtragem de exportação como a página man men . O que há de errado com minhas opções?

Exemplo de arquivos de entrada e saída:

por Mohammad Etemaddar 23.08.2014 / 09:14

1 resposta

3

Tente:

unoconv -f txt -e FilterOptions=UTF8,LF Foo.docx

Parece um erro e foi reportado aqui .

Se isso não funcionar, talvez o seu LibreOffice não suporte o arquivo docx . Veja mais detalhes aqui .

    
por 23.08.2014 / 09:39