Quand Google utilise les captchas pour numériser des livres
Par Arnaud Morel - Publié le
Étonnante révélation que celle relayée par Rue89, repérée par J'Pat : Google, qui a racheté en 2009 reCaptcha, une entreprise spécialisée dans ces petits morceaux de textes déformés à reconnaitre pour s'authentifier en tant qu'humain, utilise désormais ce service pour numériser des contenus, en l'occurrence des livres.
Et le système est fonctionnel : 30 millions d'utilisateurs reconnaissent quotidiennement ces captcha de quoi filer un bon coup de main. Selon Science, et en 2008, tous les captchas utilisés dans le monde auraient permis, s'ils avaient été utilisés de la sorte, de retranscrire 160 livres par jour.
Source
Dans chaque captcha proposé par le service, le premier mot est un mot « test », celui qui est utilisé pour savoir si oui ou non vous êtes un humain. Le second, c'est un mot contenu dans un livre numérisé, que Google n'est pas parvenu à déchiffrer. Ce mot est soumis à de nombreux utilisateurs : au bout de plusieurs réponses identiques, le mot est « appris » par l'algorithme de Google, qui pourra mieux le reconnaître dans le futur et qui l'insère dans le texte numérisé, explique Rue89.
Et le système est fonctionnel : 30 millions d'utilisateurs reconnaissent quotidiennement ces captcha de quoi filer un bon coup de main. Selon Science, et en 2008, tous les captchas utilisés dans le monde auraient permis, s'ils avaient été utilisés de la sorte, de retranscrire 160 livres par jour.
Source