Converta .doc ou .rtf para limpar HTML no OS X

2

Quando eu exporto um arquivo do Word ou do TextEdit, fico com um HTML muito inchado, cheio de tags style em todos os parágrafos, então não consigo nem limpá-lo manualmente.

A única informação que eu quero preservar é:

  • <h1>, <h2>, <h3>, <p> tags.

  • Alinhamento (centro, esquerda, direita)

  • links externos e internos (para o índice)

  • <img> tags

por iDontKnowBetter 14.02.2012 / 04:41

1 resposta

0

Ouvi dizer que o recurso de blog do Microsoft Word exporta HTML muito melhor do que o HTML filtrado no menu Salvar como.

Para tentar ir para o Word Ribbion - > Publicar - > Blog Você precisará configurar uma conta fictícia, mas se os resultados forem bons o suficiente, pode valer a pena.

Caso contrário, como sua saída esperada parece tão simples, você pode até considerar criar seu próprio script VBA, que orienta cada elemento do documento na ordem e cria uma string HTML de cada um que é salvo no disco.

    
por 05.07.2012 / 07:57