15 enero 2014

Algoritmo para detectar y predecir bestsellers

Tres científicos de la Universidad de Stony Brook, en Nueva York, afirman haber encontrado a través de un algoritmo las claves que podrían predecir un éxito editorial, el siguiente bestseller del año.

Al parecer, el algoritmo alcanza un 84% de acierto cuando se ha aplicado a libros que ya han sido publicados. Según este algoritmo, hay elementos estilísticos concretos que ayudan a predecir el posible éxito o no de un libro.

Así, estos investigadores han utilizado un proceso llamado “estilometría estadística”, es decir, un análisis estadístico de los estilos literarios de varios géneros con el cual identifican esos elementos estilísticos característicos más comunes en los libros de mayor éxito frente a los que no alcanzan dicho rango.

La investigación ha partido de los 44.500 libros de dominio público que hay en el Proyecto Gutenberg, tanto ficción, ciencia ficción y poesía. Se consideraron libro de éxito o bestseller aquellos libros aclamados por la crítica y con un alto número de descargas.

Incluyeron, además, otros libros que no estaban en el Proyecto Gutenberg, como «Historia de dos ciudades», de Dickens, o «El viejo y el mar», de Hemingway, junto a «El símbolo perdido», de Dan Brown y los últimos premios Pulitzer y galardones similares junto algunos de los “superventas” de Amazon.

Se analizaron a partes de la oración, el uso de reglas gramaticales, y otro tipo de análisis semánticos. Con ello han descubierto datos curiosos como que los libros de éxito hacen un uso frecuente de las conjunciones y las preposiciones frente a los libros de menor éxito.

También han encontrado un alto porcentaje de sustantivos y adjetivos en los bestsellers, frente a aquellos de menor éxito se basan más en verbos y adverbios para describir la acción de la trama, así como un lenguaje más negativo para hacer referencia tanto a acciones como en las descripciones, por ejemplo las parte del cuerpo.

Por otra parte, parece que según este algoritmo, los bestsellers basan más su lenguaje en verbos que describen procesos de pensamiento (recordar, reconocer) en lugar de acciones y emociones (cuando uno podría creer –al pensar en los típicos bestseller de la actualidad- que sería al contrario). El informe también aporta una serie de fórmulas gramaticales, verbos, sustantivos que parecen ser los más utilizados en este tipo de obras.

En definitiva, los novelistas que escriben más a la manera de los periodistas tienen un mayor éxito literario. Lo cual parece cierto en muchas ocasiones a la luz de los autores más vendidos.

En esta era en la que se llega a afirmar que los ordenadores o los robots podrían escribir novelas, incluso de éxito, no es de extrañar que este tipo de investigaciones se acerquen a sus objetivos, de hecho, la analítica computacional ya es algo habitual en el mundo del libro.

Si bien todos sabemos que hay factores que se escapan al conocimiento de los editores y lectores a la hora de predecir un éxito editorial, quizá, en esta época de devoluciones masivas y bajada en ventas, muchas editoriales con vocación comercial se interesen en utilizar este algoritmo para dar con el bestseller del año.

6 Responses

  1. Me extraña mucho que un algoritmo pueda dictaminar la originalidad de una obra por la que deduzco y supongo que debería ser antes reconocida una obra como «Best-seller», claro que los parámetros que dicto no entran dentro de esos nuevos top ventas de libros de la sociedad de hoy en día. Ni si quiera barajo esa idea de que pueda estar relacionada la palabra «Best-Seller» con el término de un gran libro como tiene que ser la palabra «original».

  2. Pingback : La llegada de los lectores beta | Comunicación Cultural

  3. Pingback : Yahoo estrena app de resumen de noticias para lecturas fragmentadas | Comunicación Cultural

  4. Pingback : Pentian. Nueva plataforma de crowdfunding editorial - Globalbook, Inteligencia económica aplicada al libro

  5. Pingback : ¿Podría un autor clásico de otro siglo volver a escribir una gran obra? | Comunicación Cultural

Leave a Reply