Caso você não tenha notado, o texto geralmente é confuso visualmente e mutilado para dificultar / impossibilitar o trabalho dos OCRs em CAPTCHAs. Textos não alterados, diretamente renderizados, são fáceis de extrair. Mas é claro que o reconhecimento fica melhor e melhor. A corrida continua, mas como os humanos também sofrem com textos difíceis, novas abordagens são preferíveis.