Por que um arquivo RTF em branco tem 30.6 KB?

0

Estou usando o Word2007 para criar um arquivo RTF. E no final, eu quero pegar a fonte de texto desse arquivo como {\rtf1\ansi\ansicpg1252\deff0\deflang1033{\fonttbl{\f0\fnil\fcharset0 Verdana;}}...

Veja como eu crio um arquivo RTF em branco:

  1. Novo um arquivo txt pelo menu de contexto.
  2. Altere o nome da extensão para rtf.
  3. Abra o arquivo com o Word2007.
  4. Digite alguns caracteres, remova-os e salve.

Como obtenho a fonte:

  1. Abra o arquivo RTF com o bloco de notas

Então uma enorme quantidade de personagens terminando com fffff0000 aparece o que me deixa louco ...

Alguém sabe por que isso acontece?

Obrigado

EDITAR
Estou usando o iText2.1.5 (uma biblioteca java que manipula o PDF) para gerar PDF a partir do RTF. O programa funciona bem com um antigo arquivo RTF de teste que parece muito mais limpo do que o que eu recebo do word2007 agora. Eu estou apenas criando mais arquivos RTF de teste para o programa, mas acontece que ele não pôde reconhecer a fonte do Word 2007.

Eu acho que talvez eu deva atualizar o iText ou o downgrade do Word (talvez o bom e velho arquivo de teste seja gerado pelo word2003?). Mas eu não tenho muito tempo agora.

    
por Grant Zhu 16.03.2012 / 08:53

1 resposta

3

A melhor maneira de acessar é ler as especificações do RTF . Além disso, Wordpad salva como RTF por padrão e é relativamente limpo. O Word tem muitos metadados, incluindo estilos, etc, o que o incha. O mesmo acontece ao salvar como HTML no Word; é a ruína dos desenvolvedores da Web até o ponto em que há um programa dedicado para limpar arquivos HTML do Word.

Basicamente, o Word adiciona todos esses metadados para que, quando você reabrir o arquivo no Word, seja mantida a maior quantidade possível de informações específicas do Word.

Se você pudesse nos dizer por que deseja abrir um arquivo RTF como texto simples, talvez eu possa ajudar mais.

    
por 16.03.2012 / 08:59