El sistema ReCaptcha – Crowdsourcing

Seguro que se encontraron en algunas páginas que tienen este sistema de seguridad de ReCaptcha, que básicamente es para saber que la entidad que está atrás de una computadora es una persona o una máquina que hace spam.

Entonces este sistema, te pide que vos escribas la palabra que lees en la pantalla, para que pases al siguiente paso.  Así se corrobora que es una persona que está identificando y entendiendo cuál es la palabra.

Hay un magia atrás de esto.

¿Qué pasa con la otra palabra?

Les cuento, generalmente vienen dos palabras en la imagen. De las cuales, una es conocida en la base de datos que contiene la imagen y la otra se desconoce. Si vos acertás en esa palabra conocida, pasás a lo que sigue.

Les dije que la otra palabra es desconocida para la computadora, y entonces cuando recibe la información que vos le ponés, asocia esa palabra con la imagen. Y después se lo envía a otros usuarios, para que tambien reconozcan esa palabra.

Cuando son varios los usuarios que corroboran que lo se muestra en la imagen se traduce con ciertas letras escritas, se aprueba.

Esto es lo interesante. Una Persona o varias en este caso, leen una palabra confusa, que una máquina no puede leer. Entonces, se utiliza este “servicio”.

Resulta que los que se dedican a digitalizar libros o publicaciones, tienen el problema que la máquina no puede leer ciertas palabras. Por ejemplo, la imagen siguiente:

Y ahí se juntan las dos cosas.

Este fenómeno se llama “Crowdsourcing”, millones de personas “trabajan” con muy poquito esfuerzo para una gran causa, incluso sin saberlo. Son aproximadamente unos 10 segundos que cada persona dedica a escribir esta palabra.

Se resuelven unos 200 millones de CAPTCHAS por día, si bien no todos son con este sistema, es una buena idea para aprovechar ese trabajo. Ya que serían unas 150,000 horas de trabajo por día.  Es como tener una empresa con 18,000 personas trabajando 8 hrs, para transcribir las palabras que no se entienden.

Por ahora esto se está usando para digitalizar los libros en Google Books y ediciones viejas de New York Times.

Estamos contribuyendo al objetivo de Google, ” … organizar la información mundial y hacerla accesible y útil de manera universal… “

Anuncios

Un comentario en “El sistema ReCaptcha – Crowdsourcing

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s