Por que os PDFs gerados pelo MS Word são tão grandes?

70

Eu criei um documento simples do MS Word contendo apenas esta frase:

This is a small document.

Nada mais. Então eu salvei este documento como DOCX e PDF. Aqui estão os tamanhos dos arquivos:

DOCX: 12 kB
PDF: 89 kB

Essa diferença é enorme , tecnicamente, e realmente começa a me incomodar quando documentos textuais em sua maioria dezenas de kB no DOCX começam a gerar PDFs centenas de kB grande. O que é tão ineficiente no formato PDF? Ou é apenas o Word usando algum algoritmo de saída terrível?

BTW, as configurações de saída do PDF foram definidas para criar o menor arquivo possível:

    
por Borek Bernard 30.09.2015 / 10:08

3 respostas

103

Se você abrir o PDF no notepad ++, você encontrará:

9 0 obj
<</Filter/FlateDecode/Length 79100/Length1 171804>>
stream
xœì}    XTGºvÕ9½/t7Ðl
..... many more bytes  ...   ëH|  
endstream
endobj
10 0 obj

e esse objeto é referenciado aqui no final da instrução / FontFile2:

6 0 obj
<</Type/FontDescriptor/FontName/ABCDEE+Calibri/Flags 32/ItalicAngle 0/Ascent 750/Descent -250/CapHeight 750/AvgWidth 521/MaxWidth 1743/FontWeight 400/XHeight 250/StemV 52/FontBBox[ -503 -250 1240 750] /FontFile2 9 0 R>>
endobj

Os tipos de letra utilizados pelo documento do Word são incorporados no PDF, pelo que o pdf é autónomo.

Eu usei este slide-deck para decifrar as instruções em PDF .

Se você quiser impedir que as fontes sejam incorporadas no arquivo PDF, verifique se o documento do Word usa um dos 14 tipos de fontes padrão disponíveis nos visualizadores de PDF, (fonte Wikipedia )

  • Times New Roman > Vezes (v3) (em regular, itálico, negrito e negrito e itálico)
  • Courier New > Courier (em oblíqua regular, oblíqua, em negrito e em negrito)
  • Arial > Helvética (v3) (em oblíqua regular, oblíqua, negrito e em negrito)
  • Símbolo > Símbolo
  • Wingdings > Zapf Dingbats
por 30.09.2015 / 10:46
2

Isso aconteceu comigo muitas vezes no Microsoft Word ao tentar exportar um manuscrito simples para PDF. Um documento do Word de 5 a 8 páginas, ~ 50 KB de tamanho, terminará como um arquivo PDF de mais de 10 MB, que é muito grande para ser enviado por e-mail a alguém.

A resposta de Rene está no caminho certo - o problema é que as fontes são incorporadas ao documento - mas apenas usando uma das tipologias padrão não necessariamente resolverá o problema.

Todos os meus documentos estavam em Times New Roman, usando nada mais sofisticado do que negrito e itálico. Ou então eu pensei. Acontece que tenho o kerning automático ativado no meu modelo padrão (por motivos óbvios ). Ao exportar para PDF, o Word estava realmente incorporando cada uma dessas ligaturas como um objeto de fonte separado no documento, inchando-o além de qualquer crença.

A correção é simples, você só precisa lembrar de fazer isso toda vez:

  1. Selecione todo o texto no documento.
  2. Formato → Fonte → Avançado
  3. Desmarque a opção "Kerning para fontes"

Curiosamente, você pode deixar ligaduras, alternativas contextuais e outros recursos avançados de tipografia ativados; eles não têm nenhum efeito perceptível no tamanho do PDF resultante.

Exporte novamente o documento como PDF, e ele está com até cem KB. Infelizmente, o kerning é sub-par, então eu não recomendo imprimir desta forma, mas funciona bem para enviar um documento por e-mail.

    
por 15.02.2016 / 11:54
-3

Para dar uma resposta menos técnica, pode ser que os PDFs usem vetores (por exemplo, equações matemáticas) para descrever tudo o que você vê. Todas as curvas e linhas são definidas por equações matemáticas e, portanto, haverá necessariamente muitas informações a serem mantidas, principalmente quando você tiver imagens em seus documentos.

O benefício disso é que você pode, teoricamente, ampliar infinitamente o zoom sem perder nenhuma resolução ou detalhe, porque as linhas e curvas não têm largura, então elas podem ser dimensionadas com o zoom.

Assim como a mudança recente de fonte do Google reduziu o tamanho do logotipo de ~ 14KB para ~ 300B, fontes mais simples provavelmente ajudarão a reduzir o tamanho do arquivo.

    
por 01.10.2015 / 18:13