Extrai o texto OCR do Evernote

13
O

Evernote faz o OCR nas imagens que você salva nele. Existe uma maneira de obter o equivalente em texto completo para uma imagem no Evernote, ou o OCR é apenas para pesquisa?

    
por Leigh Riffel 09.06.2010 / 19:28

6 respostas

15

A API do Evernote tem funcionalidade para obter texto e retângulo onde este texto está presente dentro da imagem. Veja o link , confira o "Formato XML do Índice de Reconhecimento Evernote" e as funções para recuperá-lo. O problema é que eles não fazem o OCR tradicional ... seu algoritmo OCR pode produzir palavras diferentes para uma única "palavra" na imagem. Tudo o que eles usam é para pesquisa, então isso é bom para eles, mas não é bom para usá-lo como um mecanismo de reconhecimento. (Embora eles te dêem peso para cada palavra alternativa, então talvez você possa usar isso)

    
por 13.07.2011 / 14:05
11

Além disso, o Evernote aparentemente não decide que uma imagem em particular é equivalente a exatamente uma palavra - por exemplo, o Evernote não determina que uma determinada imagem é "indício" e não é "vencida". Em vez disso, ele rastreará ambos e uma pesquisa por qualquer um retornaria a mesma imagem. Portanto, não há como obter um equivalente a texto completo porque o Evernote não está decidindo qual é o texto completo, apenas o que poderia ser.

    
por 26.08.2010 / 16:26
5

o evernote paga uma quantia decente ao criador do material OR ou paga uma quantia decente para colocar algo trabalhando em conjunto. assim, eu realmente duvido que eles deixarão você pegar o texto extraído (+ posicionamento na imagem).

(pode ser um modelo de negócio, para digitalizar imagens de outras pessoas e fornecer boas ocr:))

então, a resposta é: não.

    
por 09.06.2010 / 20:22
2

Não sei ao certo quanta sofisticação você precisa, mas como também uso o Adobe Acrobat, basta clicar com o botão direito no anexo do Evernote para abrir com o Acrobat.

Em seguida, no Acrobat, selecione "Document | OCR recognition de texto" e salve o documento como texto simples.

Isso funciona bem para mim, pois só preciso de uma conversão ocasional de OCR.

    
por 28.08.2012 / 17:34
1

Se você pudesse tirar todas as imagens do Evernote, poderia fazer o OCR com o Google Docs.

Você pode fazer upload de uma pasta de imagens para o Google Docs e convertê-las em Documentos, que conterão a imagem e o texto oculto.

Você pode fazer o download em lote de todos esses documentos como texto simples, o que removerá a imagem.

Se você nomear todas as imagens do Evernote com um hash (por exemplo, md5 ), será fácil vincular arquivos de texto simples baixados do Google Docs com a imagem original.

    
por 21.06.2011 / 23:53
0

Estou no Windows e uso o Adobe Acrobat Pro e o Word, portanto, faço o seguinte:

  1. se o arquivo não for salvo como um JPG, clique no ícone do globo ocular no canto superior esquerdo da imagem no Evernote para abri-lo em foto Visualizador e clique em Arquivo > "Faça uma cópia" para salvar como um JPG
  2. navegue até o arquivo de imagem no Explorer
  3. clique com o botão direito do mouse sobre ele e selecione Converter para Adobe PDF (o arquivo será aberto em Acrobat)
  4. clique em Arquivo > Salvar como e selecione Rich Text Format no menu "Salvar como tipo "dropdown para salvar como um arquivo de texto rico (leva um minuto para arquivo de processo)
  5. navegue até o arquivo RTF no Explorer e clique duas vezes para abrir no Word
  6. edite conforme necessário
por 06.01.2017 / 19:20

Tags