Como redirecionar a saída do arquivo para stdout?

2

Gostaria de extrair os títulos de vários documentos do Word. Todas as ferramentas CLI que eu tentei para converter .doc em texto perdem o título ... mas a conversão do Abiword para RTF preserva-o, por exemplo:

$ abiword --to=rtf something.doc

fornece algo.rtf , um arquivo codificado por texto que inclui o título.

Até aí tudo bem, mas eu preciso de uma linha do arquivo, escrevendo parece muito desperdício. (por exemplo, se eu conseguisse que a saída fosse para stdout, eu executaria isso com o subprocesso do Python, capturaria e aplicaria um regex para obter uma lista de títulos).

Mas, a menos que esteja faltando alguma coisa, a ferramenta CLI do Abiword não parece estar configurada para saída para saída padrão. Você pode:

  • especifica o formato de saída, dando nome de arquivo original + nova extensão ou
  • especifica o nome do arquivo; O Abiword infere o tipo de arquivo da extensão.

Existe uma maneira de contornar isso e apenas obter a saída via stdout?

    
por birone 14.04.2015 / 19:09

2 respostas

2

Há um exemplo na página abiword man:

abiword --to=rtf --to-name=fd://1 something.doc
    
por 14.04.2015 / 19:41
1

-o funciona sem o '=', por exemplo:

abiword --to = rtf -o fd: // 1 algo.doc

    
por 15.04.2015 / 11:05