Usando o OCR no texto em árabe

3

Um amigo solicitou que eu convertesse um texto em árabe .pdf para o Word. O Google Docs não parece uma opção, mas o novo OCR pareceu promissor porque o árabe é exibido na lista suspensa 'Idioma de reconhecimento'. Eu não consegui fazer isso funcionar além de "Erro! O texto não pode ser reconhecido". mesmo com apenas algumas páginas de amostra (111KB).

Eu apreciaria muito qualquer conselho sobre o que estou fazendo de errado naquele site (ou até mesmo como acessar qualquer ajuda disponível lá!) ou apontando para outras opções (grátis!) que funcionam com texto em árabe (de preferência que não requerer registro e / ou downloads grandes). Alguém disposto a ajudar por favor?

Observe que o .pdf não possui uma camada de texto.

    
por pnuts 18.10.2012 / 19:30

1 resposta

1

Como a pergunta não foi uma solicitação de recomendação do melhor programa (presumivelmente, isso seria um tópico fora do assunto), mas sobre como fazer com que o novo OCR funcione da maneira que deveria, ou para qualquer outro conversor gratuito que funcione para o texto em árabe, acho justo dizer que OCR Convert é uma resposta. Isto é online, gratuito e não requer registro.

Ele não gerencia todas as 67 páginas de uma só vez (após cerca de 15 minutos o programa relatou um erro), mas converteu 10 páginas de uma só vez. A qualidade / precisão é suspeita (com base na tradução com o Google), mas estou feliz em considerar isso como um problema separado.

    
por 22.01.2013 / 12:01

Tags