Eu preciso converter alguns arquivos HTML muito grandes (cerca de 800 KB, PDF equivalente a cerca de 30 páginas) no MS Word. É fácil até certo ponto: basta abrir no Word e salvá-lo novamente como docx. O problema é que o documento do Word resultante tem mais de 3 MB e leva dez minutos para ser aberto. É quase inutilizável.
Um problema pode ser - o HTML tem um número enorme de elementos de formulário, e o documento do Word convertido tenta mantê-los ativos (assim, por exemplo, os conjuntos de botões de rádio continuam a funcionar como em um navegador da web). Isso não é necessário. Tudo bem se eles fossem convertidos apenas em coisas estáticas. O ponto da palavra docs é apenas dar aos revisores um formato conveniente para revisar e comentar a parte do texto.
Alguém sabe de - - uma maneira de desativar globalmente todos os elementos de formulário em um documento do word ou convertê-los em algumas imagens equivalentes estáticas ou o que for? - um utilitário que irá converter HTML para o Word e omitir os recursos que causam o inchaço do documento? - outros truques para reduzir o mega-bloat em grandes arquivos HTML abertos no Word?
Tags html microsoft-word