Há um exemplo na página abiword
man:
abiword --to=rtf --to-name=fd://1 something.doc
Gostaria de extrair os títulos de vários documentos do Word. Todas as ferramentas CLI que eu tentei para converter .doc em texto perdem o título ... mas a conversão do Abiword para RTF preserva-o, por exemplo:
$ abiword --to=rtf something.doc
fornece algo.rtf , um arquivo codificado por texto que inclui o título.
Até aí tudo bem, mas eu preciso de uma linha do arquivo, escrevendo parece muito desperdício. (por exemplo, se eu conseguisse que a saída fosse para stdout, eu executaria isso com o subprocesso do Python, capturaria e aplicaria um regex para obter uma lista de títulos).
Mas, a menos que esteja faltando alguma coisa, a ferramenta CLI do Abiword não parece estar configurada para saída para saída padrão. Você pode:
Existe uma maneira de contornar isso e apenas obter a saída via stdout?
-o funciona sem o '=', por exemplo:
abiword --to = rtf -o fd: // 1 algo.doc
Tags command-line