Archivos Mensuales: enero 2012

La verdadera utilidad del ReCaptcha

 El captcha, es definitivamente una pérdida de tiempo que resulta inevitable para el buen funcionamiento de tantas webs (protege a unas 100.000 páginas web del fraude y el spam). Pero entre tanto fastidio, la misión de la charla parece encaminarse a convencer a quienes pasamos por la prueba captcha y lo odiamos, que hay algo productivo cuando interpretamos y tecleamos los extraños caracteres: estamos colaborando para digitalizar libros.

 Von Ahn creó el sistema captcha, y se lo vendió a Google en su evolución reCaptcha. Y Google, hoy utiliza el sistema para completar su proyecto de digitalización de libros, un proyecto en el que sin saberlo, participamos millones de personas a diario. Se estima que 200 millones de odiosos captcha son completados en un día, lo que suma (a un promedio de 10 segundos por captcha) unas 500 mil horas diarias. Von Ahn necesitaba convencer a los 1.600 usuarios fastidiados de su invento, que aunque es antipático, el captcha sirve para algo productivo. La idea de completar la digitalización de libros a través del captcha, es en definitiva, un consuelo para su conciencia.

 Resulta que los sistemas que escanean libros antiguos de forma automática para digitalizarlo, no son perfectos: en el reconocimiento óptico de caracteres (OCR) pueden tener dificultades para “interpretar” ciertas palabras impresas con tinta borrosa, o gastadas, una dificultad que suele alcanzar el 30% de lo escrito.
 La idea genial es mostrar esas palabras distorsionadas que las computadoras no saben interpretar a través de las pruebas captcha. Una palabra no reconocida en la parte automática de la digitalización, pasa a la base de datos de Recaptcha, que se las muestra a algún usuario que “inocentemente” la interpreta, la teclea, y la envía. Cuando varios usuarios coinciden al interpretar el mismo captcha, la palabra queda confirmada y digitalizada completando algún fragmento de un libro.
 Ésto también explica la razón por la que el sistema recaptcha nos muestra dos palabras a la hora de determinar si no somos un robot: una es para hacer el control “antirobots” tradicional, y la otra una palabra para digitalizar en algún libro. El problema es que no sabremos cual es cual.
 Von Ahn explica que con éste mecanismo se están digitalizando alrededor de 100 millones de palabras diarias, o lo que se traduce, suma dos millones de libros al año. Para más cifras, 900 millones de personas estamos a diario ayudando a digitalizar libros mientras respondemos a un reCaptcha.

Fuente: matiascallone

Anuncios

Como montar las cadenas en el coche (video)

Ahora que la nieve ya está por aquí os pongo este video de Paco costas en el que nos enseña a poner las cadenas en el coche