Extrai dados estruturados de muitos arquivos do MS Word

1

Eu tenho ~ 160 arquivos do MS Word que contêm dados estruturados. Os dados são formatados de forma idêntica em todos os arquivos e residem em um formato tabular.

Gostaria de extrair os dados em um banco de dados, XML ou apenas uma tabela agregada sem abrir cada um dos arquivos de forma independente.

Existe uma ferramenta ou método que eu possa usar para extrair esses dados?

    
por Mark Elliot 08.06.2010 / 23:04

1 resposta

1

Bem, você poderia escrever um código usando python (ou qualquer outra linguagem, mas eu prefiro python: D) para extrair os dados dos arquivos e colocá-los em um banco de dados. Você pode usar o módulo UNO do Python para usar a API de escritório aberto e extrair os dados. Algum exemplo de código em python que pode ajudá-lo a link . O código geral deve ser fácil de escrever se os dados estiverem bem estruturados.

    
por 09.06.2010 / 00:24