Algoritmos y curación en Spotify
El éxito –ya lo hemos comentado en diversas ocasiones– de plataformas como Spotify o Netflix se basa en gran parte en la inversión que hacen en mejorar sus algoritmos de recomendación y en el poder que tales recomendaciones tienen sobre sus usuarios.
Por tanto, lo lógico es que esta inversión e investigación sea continuada. Así lo hace Netflix y así –leíamos hace unos días en Hackermoon– lo hace Spotify.
En el caso de esta última, a propósito de su último servicio de recomendación de listas de reproducción llamada ‘Discover Weekly’ –después del aclamado ‘Your Time Capsule’-, descubrimos que también utilizan diferentes modelos de recomendación para que la labor de curación de contenidos –en este caso música- sea mucho más acertada.
Tres son los tipos de modelos de recomendación que señala en el mencionado artículo que, unidos, conforman su particular herramienta de descubrimiento de nuevas canciones y grupos de música: el filtrado colaborativo (análisis y comportamiento de usuarios y entre usuarios), procesamiento de lenguaje natural (o PNL, que funciona mediante el análisis de texto), y el modelo directo de audio (analizando las pistas de audio sin procesar).
El primer modelo, el colaborativo añade a las valoraciones habituales (por ejemplo las ya famosas estrellas) tanto comentarios implícitos, como recuento de los temas o pistas escuchados o datos de usos y navegación (guardar pistas, visitar perfil de un grupo, etc.). De manera muy resumida, todo queda recogido en dos vectores: usuario y canción. Al comparar estos vectores entre usuarios, el resultado revela los hábitos y gustos de los usuarios más similares.
El segundo modelo, el del procesamiento del lenguaje natural -que pudimos ver aplicado ya en museos o en herramientas como Trajectory o Tekstum-, se dedica a rastrear metadatos, artículos, blogs, y todo lo analizable de manera textual en la web que haga referencia a la música y artistas. Cada término descriptivo se une a la representación vectorial de cada canción para determinar si dos temas, por ejemplo, son similares.
Por último, el modelo de audio sin procesar, al contrario que los anteriores, no es discriminatorio, y añade pistas nuevas que se pueden sumar a las pistas más populares o conocidas, complementando así el valor de la recomendación, la razón del descubrimiento de lo nuevo. Se hace a través de un complejo análisis que comprende las características de cada canción con las cuales busca nuevas similitudes entre vectores.
El asunto, por tanto, no es sencillo, pero el resultado en este caso parece efectivo. No obstante, para añadir mayor potencial a este tipo de recomendaciones, las plataformas tienen que lograr el máximo de contenidos, de otro modo para algunos usuarios más exigentes siempre faltarán las recomendaciones necesarias.
De ahí el valor de lo realmente nuevo por conocer de estas plataformas.