11 febrero 2019

Un algoritmo que genera libros de texto

Los Wikibooks o Wikilibros son una iniciativa de Wikimedia que lleva funcionando desde 2003.

Se trata básicamente de una serie de libros de texto que se editan de manera colectiva, del mismo modo que los artículos de Wikipedia (de hecho, están compuestos de entradas científicas y académicas de esta enciclopedia colaborativa online). Es decir, cualquier miembro registrado puede acceder y editar los contenidos de estos libros de texto.

Se sigue la misma metodología: se actualizan constantemente con los últimos descubrimientos o teorías y se editan constantemente para corregir errores y ambigüedades. El problema de estos textos para el estudio es hacer la criba, la elección de artículos de la Wikipedia en los que basarse, ya que hay temáticas que tienen cientos de entradas relacionadas.

Aquí es donde entra la inteligencia artificial y los algoritmos. La inclusión de esta tecnología es para lograr que la edición de los textos sea coherente y dé como resultado un libro uniforme.

Ha sido en  la Universidad Ben-Gurion del Negev en Israel donde han desarrollado esta manera de generar Wikilibros automáticamente mediante el aprendizaje automático. A su programa lo han llamado Wikibook-bot, la IA que consigue  generar un Wikilibro completo, sin participación humana.

Después de identificar una serie de Wikilibros ya existentes que pudieran servir como base de entrenamiento (6.700 Wikilibros, en concreto)  que han servido como estándar, se eligieron aquellos  que fueron vistos al menos 1.000 veces, “sobre la base de la suposición de que los Wikilibros populares son de una calidad razonable”.

Tras la selección, el equipo dividió la tarea de crear un Wikilibro en varias partes, cada una de las cuales requiere una habilidad de aprendizaje automático diferente. La tarea comienza con un título generado por un humano, que describe un concepto concreto.

La primera tarea es clasificar todo el conjunto de artículos de Wikipedia para determinar cuáles son lo suficientemente relevantes para incluirlos siguiendo la misma estructura de red de esta enciclopedia: los artículos a menudo apuntan a otros artículos que usan hipervínculos y que suelen ser los más relevantes.

Comparando los 407 Wikilibros elegidos creados por humanos  y su enfoque automatizados, descubrieron que estos incluían gran parte del contenido original de Wikibook, pero también mucho más nuevo. Tras esto el equipo creó un algoritmo que examinó cada artículo seleccionado automáticamente para un tema determinado y luego determinó si incluirlo en un Wikilibro haría que la estructura de la red fuera más similar a los libros generados por el hombre o no.

El último paso es determinar el orden en que deben aparecer los artículos en cada capítulo. Para hacer esto el equipo organiza los artículos en pares y utiliza un modelo basado en red para determinar cuál debe aparecer primero. Al repetir esto para todas las combinaciones de pares de artículos, el algoritmo establece un orden preferente para los artículos y, por lo tanto, también para los capítulos.

El resultado final son las  versiones automatizadas de Wikilibros que ya habían sido creados por humanos. Es decir, mejorados, en cierto modo.

Leave a Reply