Análise automática de conteúdo de software de arquivos pdf [fechada]

1

Existe um software open sourc / commercial que pode executar análise automática de conteúdo (para produzir sumários desejosos) em uma grande coleção de documentos pdf que marcaram metadados para facilitar a classificação? Qual é a tecnologia que o Google usa para analisar o pdf hospedado na web e classificá-los?

    
por iceman 16.05.2010 / 05:26

1 resposta

0

Não sei ao certo o que o Google usa, mas é possível ler e criar documentos em PDF no lado do servidor com um componente de software como o ABCpdf.NET. Isso requer algum conhecimento de programação em ASP ou ASP.NET (Active Server Pages) para servidores Microsoft IIS ou PHP para servidores web Apache.

    
por 17.05.2010 / 13:40