21 abril 2020

Metadatos y algoritmos actualizados para que todo el contenido online sea visible

Imagen de Central Asia para Flickr

En el mundo de Internet tener mucho contenido que ofrecer no supone obligatoriamente una ventaja.

Mucha de esa colección de contenido, muchas veces valioso, se puede perder o ni siquiera aparecer a los ojos de los internautas.

Para que eso no ocurra, para que aparezca en los resultados y pueda ser descubierto es necesario un laborioso trabajo con los metadatos.

Esto es lo que le ocurre a la BBC y su cantidad ingente de contenido histórico digitalizado. Quieren que las audiencias, sobre todo las nuevas, puedan acceder a su archivo digital presente en sus diversas plataformas online, y para ello están acudiendo a los algoritmos.

Lo que se busca, en definitiva, es establecer una estrategia de descubrimiento y personalización mediante metadatos cada vez más detallados que describan todo su contenido utilizando en todos los casos la misma terminología y las mismas herramientas y modelo de datos.

Hasta el momento  se han centrado en los metadatos de contenido descriptivo: etiquetas que describen de qué trata un activo (por ejemplo, un artículo, programa televisión o audio, reportaje, etc.) o de quién / qué menciona.

La idea es poder ofrecer material que cubra tanto la amplitud de su contenido online como poder  satisfacer los gustos y necesidades de todas las diferentes audiencias.

Para ello han necesitado dar un paso más, por lo que están desarrollando herramientas que hacen posible la descripción del contenido en todas las etapas de producción, así como un posible nuevo vocabularios que permita descripciones más ricas del contenido.

Para hacer esto posible, han desarrollado un concepto en el que cada contenido tiene un conjunto básico de metadatos comunes asociados, y que se evidencia donde sea que aparezca en la cartera de contenidos de toda la BBC online (radio, música, noticias).

Almacenan este conjunto de metadatos comunes básicos –y que denominan «pasaporte»- para crear y administrar tales metadatos en la herramienta llamada ‘Control de pasaportes’.

Así, usando un modelo gráfico simple crean relaciones de ‘sujeto-predicado-objeto’ para describir la naturaleza de la relación entre un activo (el sujeto) y una etiqueta (el objeto).

Cada predicado se puede usar con un vocabulario controlado asociado de términos. En algunos casos, estos lenguajes controlados  son jerarquías taxonómicas (como pueden ser los géneros de la BBC), mientras que en otros son simples listas de términos que han desarrollado para describir su producción de manera que tenga sentido para tanto para ellos como para su audiencia.

Por tanto, estos nuevos tipos de metadatos se pueden usar para hacer colecciones de contenido mucho más ricas, ya sea como curaciones editoriales manuales o recomendaciones generadas algorítmicamente.

El trabajo de relación entre este enriquecimiento de metadatos asociado a los algoritmos inteligentes que personalicen las recomendaciones no ha terminado.

En realidad sabemos que es un trabajo que nunca puede terminar a medida que los términos de búsqueda varíen según las audiencias.

Aquí es donde los algoritmos de deben saber establecer las relaciones.

Leave a Reply