Convertendo um documento do word para o formato XML enquanto preserva as informações da fonte

0

Eu preciso converter um documento do Word em um formato facilmente analisável, então escolhi o XML. Eu encontrei uma ferramenta que funciona, mas não funciona diga-me qual é a fonte do texto, que é o meu principal método de análise. Existe alguma ferramenta que preserva esta informação ou um link para um tutorial que fornece código?

    
por gsingh2011 27.02.2012 / 17:49

2 respostas

0

Você precisa de um documento XSL acompanhante, isso deve ajudar: link

    
por 27.02.2012 / 17:51
0

O Word 2012 (e o Word 2007 via add-in) pode armazenar documentos do Word em WordML (.docx) com formato xml.

Este formato é facilmente analisável - existem bibliotecas para vários idiomas e algumas, como o .NET, têm recursos de análise integrados.

    
por 25.01.2013 / 02:27