Como analisar se um arquivo PDF é válido?

2

Tenho tido problemas com arquivos PDF gerados pelo Office2007. Você pode ler tudo sobre isso aqui .

TL;DR: Some PDFs generated from PPTX files using the "Save as PDF/XPS..." add-in are rendered only partially and trigger error messages in Adobe Reader/Acrobat Pro.

Depois de tentar muitas outras opções descritas na resposta do @ harrymc à minha outra pergunta e após a confirmação de outros usuários que encontraram o mesmo problema, decidi envolver o suporte da Microsoft, que é bastante caro (€ 299 + impostos que você só será reembolsado se o incidente de suporte descobrir um bug em um produto MS e se o suporte decidir que, na verdade, é um bug).

Meu problema agora é que, na primeira chamada de retorno, o suporte técnico sugeriu que se o Adobe Reader / Acrobat estivesse tendo problemas com o arquivo, mas o Foxit ou o Chrome pudessem processá-lo corretamente, é problema da Adobe, não deles. Então agora parece que eu preciso ser capaz de provar que o PDF gerado é de fato inválido.

Na minha outra pergunta, @harrymc forneceu uma mensagem de erro do GhostScript que sugere que há, de fato, um erro no PDF. Mas posso realmente levar isso como prova? Existe algo como um validador oficial de PDF que pode apontar exatamente o que há de errado com o meu arquivo? Ou com o Adobe?

Para referência, aqui está um arquivo que está causando esses problemas .

ATUALIZAÇÃO:

O suporte técnico da MS foi capaz de reproduzir o problema (mesmo em seu próprio visualizador XPS), e eles concordam que é um bug (embora eles o chamassem de "limitação", preciso lembrar disso), então eu não precisarei pagar pelo incidente. Eles passarão para os desenvolvedores, mas não poderão garantir uma correção e recomendaram uma atualização para o Office 2010. Eu vou ter que ver se minha universidade vai jogar junto com isso - o nosso padrão é atualmente o Office 2007, mas eu sei o meu licença também é válida para 2010.

    
por Tim Pietzcker 06.03.2012 / 12:08

2 respostas

4

Do validador da Adobe (Comprovação no Acrobat X Pro):

Cliqueparaotamanhocompleto

Eunãovejoquantomaisoficialvocêpodeconseguir.Issoaconteceuemum"Relatar problemas de sintaxe do PDF" no Preflight. A mesma coisa quando tentei testar a validade do PDF / A. O processo de relatório é abortado em vez de continuar, como faria para pequenos erros. Não há resposta nos inúmeros posts do fórum da Adobe sobre esse erro.

Abrir o arquivo no Notepad ++ e extrair todos os fluxos ( stream to endstream inclusive) leva a um arquivo em branco que não reporta um erro na abertura e apenas alguns pequenos erros de sintaxe no Preflight (relacionado à falta fluxos). Obviamente, há algo inválido em / sobre um desses fluxos, talvez um caractere de controle inválido ou algo assim. Eu não sei muito sobre o formato PDF.

Além disso, a criação de PDFs usando a ferramenta integrada funciona perfeitamente em sua apresentação no PowerPoint 2010. Parece que somente o 2007 SP3 é afetado - como você se encontrou, nenhuma versão anterior foi e nenhuma versão posterior é. Dependendo da política da Microsoft, isso pode ou não justificar uma correção de bug. Pode ser que a codificação usada na versão do 2007 SP3 para imagens não seja totalmente suportada pela Adobe.

O arquivo fornecido por você foi exportado com a opção "Compatível com ISO 19005-1 (PDF / A)" está marcada? Se não, você poderia fornecer um que seja?

A menos que o arquivo seja exportado como um formato compatível com padrões (essa opção é desmarcada por padrão!), não é necessariamente um 'bug', a menos que explicitamente diga que o Adobe Acrobat / Reader deve abrir seus PDFs - especialmente quando alguns programas podem. Você pode estar lutando uma batalha difícil pelo reembolso.

    
por 06.03.2012 / 14:33
3

Antes de enviar € 360, eu verificaria se o problema já estava corrigido no Office 2010.

Se você deseja obter uma resposta dos especialistas, sugiro postar a pergunta no GhostScript Bugzilla . Você poderia simplesmente perguntar por que eles não aceitam o PDF legal criado pelo Office 2007. Eles provavelmente dirão exatamente por que o PDF está errado e talvez até como consertá-lo.

Isso exigirá que você abra uma conta no Bugzilla.

Verifiquei que o problema ainda está acontecendo na última versão do GhostScript 9.05. Você poderia incluir a imagem abaixo com seu relatório de erros:

    
por 06.03.2012 / 13:01