O Acrobat 11 pode fazer o OCR usando vários núcleos de CPU?

8

O processamento de OCR leva tempo. Usar vários núcleos de CPU aceleraria o processamento. O Acrobat 10 não era um não um aplicativo multithread . Como sobre o Acrobat 11? Por padrão, o 11 faz OCR usando vários núcleos de CPU (se disponível)? Se não, existem algumas soluções alternativas, por exemplo scripts, para ajudar a fazer o Acrobat 11 fazer OCR usando vários núcleos de CPU? Seja por meio da linguagem de script incorporada do Acrobat ou usando scripts externos que iniciam e direcionam várias instâncias de encadeamento único do Acrobat em paralelo a partes do trabalho de processamento.

Nota: Esta questão não é muito localizada (não se limita a um momento específico) porque (1) a Adobe não lança novas versões principais do Acrobat com muita frequência (o Acrobat 10 foi lançado há dois anos) e (2) Adobe Acrobat é uma aplicação amplamente utilizada.

    
por tarcman. 27.10.2012 / 01:38

3 respostas

6

Eu instalei o teste do Acrobat 11 (XI) VirtualBox. O Acrobat 11 é de encadeamento único.

Também fiz um script externo que inicia várias instâncias do Acrobat (uma por núcleo da CPU), processa paralelamente a tarefa de OCR e mescla o resultado. Uma etapa crucial é ativar o registro de erros nas preferências do Acrobat, analisar todo o .log e reprocessar os arquivos de erro. O script (ao usar 4 núcleos) ainda faz OCR duas vezes mais rápido que o padrão do Acrobat 11.

    
por 29.10.2012 / 09:05
1

O multithreading precisa ser incorporado em um aplicativo. O desenvolvedor precisa escrever um código que crie threads e que divida a tarefa em subtarefas que podem ser alocadas a cada thread. Se os desenvolvedores do Acrobat não conseguirem fazer isso por seu código de reconhecimento OCR, não há como o usuário criar a lógica extra necessária.

    
por 27.10.2012 / 02:55
0

Para usar todos os núcleos para o OCR, convém consultar o PDF-Exchange Editor. Seu mecanismo OCR parece usar todos os núcleos no meu sistema. Uma vez que você chegar a este nível de desempenho, faz sentido usar um SSD.

Deve haver um ajuste de janelas que fará com que ele dedique mais tempo de CPU a um único aplicativo encadeado que não seja vinculado a E / S. No meu sistema, o Acrobat não está sendo desacelerado pelo desempenho do disco, mas a maior parte do tempo de CPU que construo um índice é de cerca de 30%.

Vamos admitir, o Acrobat é um aplicativo amplamente usado, mas mal escrito. O Acrobat Pro possui alguns recursos que você ainda não consegue em nenhum outro lugar (ainda).

    
por 04.10.2017 / 12:29