Como o recaptcha sabe que você não está entrando em traduções falsas das imagens [fechadas]

22

Pelo que entendi, captchas são textos que foram distorcidos pela aplicação de filtros, ruído e outros algoritmos miscelâneos. Portanto, para descobrir se a capacidade de leitura da pessoa é a de uma pessoa, compare o que ela respondeu à resposta conhecida.

Agora, lendo o ReCaptcha, ele diz que as palavras exibidas são aquelas que não podem ser traduzidas pelo OCR. Além disso, recaptcha está sendo usado para traduzir essas imagens. Como pode dizer se você está de fato certo em sua leitura ou está inventando coisas?

Se soubesse o que dizia, não seria usado em recaptcha como material de tradução. Se não souber o que o texto diz, então como ele valida sua resposta?

Eu estou supondo que isso é provavelmente uma análise baseada em probabilidade com amostras enormes antes de mostrar qualquer coisa como traduzida.

Alguém sabe onde está a resposta para isso?

    
por Zigu 01.10.2011 / 04:26

2 respostas

33

As páginas do livro são basicamente escaneadas fotograficamente e depois transformadas em texto usando "Reconhecimento Ótico de Caracteres" (OCR) e alimentadas na Web na forma de uma imagem com uma palavra que é conhecida pelo programa de computador por trás do reCAPTCHA e uma palavra isso ainda não é conhecido.

O usuário então digita ambas as palavras e, se elas solucionam aquela para a qual a resposta é conhecida, o sistema assume que a resposta está correta para a nova. O sistema, em seguida, dá a nova imagem para um número de outras pessoas para determinar, com maior confiança, se a resposta original estava correta. Portanto, o sistema é um auto-aperfeiçoamento serviço que fica melhor com o tempo.

link

    
por 01.10.2011 / 04:50
22

É por isso que reCaptcha você digita duas palavras. Uma das palavras já é conhecida e uma das palavras não é conhecida. Quer você passe ou falhe, o captcha depende apenas de como você responde pela palavra que é conhecida. Sua resposta para a outra palavra (desconhecida) será usada, junto com outras respostas à mesma palavra, para transformá-la em uma palavra conhecida também.

    
por 01.10.2011 / 05:02