Você precisa de um documento XSL acompanhante, isso deve ajudar: link
Eu preciso converter um documento do Word em um formato facilmente analisável, então escolhi o XML. Eu encontrei uma ferramenta que funciona, mas não funciona diga-me qual é a fonte do texto, que é o meu principal método de análise. Existe alguma ferramenta que preserva esta informação ou um link para um tutorial que fornece código?
Você precisa de um documento XSL acompanhante, isso deve ajudar: link
O Word 2012 (e o Word 2007 via add-in) pode armazenar documentos do Word em WordML (.docx) com formato xml.
Este formato é facilmente analisável - existem bibliotecas para vários idiomas e algumas, como o .NET, têm recursos de análise integrados.