Eu tenho uma instalação do Drupal e um monte de arquivos DOCX. Como - vários anos de sermões dominicais? Eu não quero preservar 99% da formatação, mas eles têm notas de rodapé. Eu particularmente não me importo como as notas de rodapé aparecem quando são adicionadas como conteúdo do Drupal, contanto que realmente apareçam. Eu encontrei alguns conversores de DOCX para HTML, mas todos eles incluem um monte de coisas de formatação e nenhuma opção para desativar que eu possa encontrar. Como, o LibreOffice salva como HTML mantém todos os tipos de fontes e coisas e transforma tudo em CSS. Salvar como texto no LibreOffice parece reter os números da nota de rodapé, mas perde o conteúdo.
Manter coisas como negrito / itálico seria bom, mas eu não quero as margens, fontes, etc, porque o site Drupal tem seu próprio estilo. São apenas as notas de rodapé bobas que não posso perder.
Como alternativa, acho que uma ferramenta para remover todas as tags / estilos extras também pode funcionar, mas não tenho certeza se isso existe.
Obrigado!