A API do Evernote tem funcionalidade para obter texto e retângulo onde este texto está presente dentro da imagem. Veja o link , confira o "Formato XML do Índice de Reconhecimento Evernote" e as funções para recuperá-lo. O problema é que eles não fazem o OCR tradicional ... seu algoritmo OCR pode produzir palavras diferentes para uma única "palavra" na imagem. Tudo o que eles usam é para pesquisa, então isso é bom para eles, mas não é bom para usá-lo como um mecanismo de reconhecimento. (Embora eles te dêem peso para cada palavra alternativa, então talvez você possa usar isso)