17 septiembre 2009

Google compra ReCaptcha para mejorar la digitalización de libros

Google ha adquirido la compañía ReCaptcha para mejorar el proceso de digitalización de libros, reconociendo así que los seres humanos son mejores que los algoritmos informáticos para según qué tareas. Esta empresa utiliza un método que sus creadores llaman «computación humana», es decir, capital intelectual humano para ayudar a resolver los problemas de los ordenadores que no pueden resolver por sí mismos. The New York Times, por ejemplo, ya ha utilizado los servicios de esta empresa para escanear 150 años de archivos.

Es una compra muy estratégica por parte de Google para mejorar el servicio a lectores, bibliotecarios y libreros. En los últimos meses varios bibliotecarios de prestigiosas Universidades norteamericanas habían señalado graves errores en la indexación de sus libros (fecha, clasificación, etc.) en el programa de digitalización de libros. Como ejemplo valga la imagen que acompaña al post: ¿Jane Eyre dentro de “arquitectura” o “antigüedades”? Los errores de este tipo son múltiples, como cualquiera que haya buscado algún libro en Google Books habrá podido observar sorprendido.
Por otra parte, según algunos bibliotecarios generosos con Google, éste es un problema común en relación a cualquier catalogación y el uso de los metadatos. Cualquier persona puede crear y almacenar metadatos en Internet. El ejemplo: si se pone el mismo libro en frente de diez catalogadores diferentes se puede obtener diez números de llamada diferentes y diez encabezamientos distintos de la materia. Este es el problema con los metadatos, no hay control de calidad y, además, no todos los metadatos son recuperables a partir del texto. Sabemos que el OCR da muchos problemas al respecto. Aún así, estos mismos bibliotecarios de los Estados Unidos afirman que se pueden encontrar problemas similares con los metedatos de Google en cualquier catálogo de biblioteca como la Biblioteca del Congreso, Harvard, Yale, Universidad de Michigan, etc.
Como sea, la compra de esta compañía intentará subsanar todos estos problemas en Google Books, sobre todo con libros más antiguos. Y una buena noticia: los bibliotecarios no van a desaparecer dado que van a ser más necesarios que nunca.

Leave a Reply