02 noviembre 2016

El mercado de los grandes datos

bigdatamarketA la hora de profundizar en los entresijos del Big Data, uno de sus aspectos clave es saber qué tipo de herramientas utilizar, cuál es la mejor para según qué tipo de análisis y empresas.

El informe de Aman Naimat “The Big Data Market. A Data-Driven Analysis of Companies Using Hadoop, Spark, and Data Science”, publicado por O’Reilly y de libre acceso, da luz sobre qué compañías usan Hadoop o Apache Spark, dos de las herramientas de uso más frecuente, entre otras, cómo las implementan y cuál es su precio aproximado. Todo ello basándose en cientos de miles de documentos públicos y en el análisis de más de 500.000 empresas importantes para recopilar los resultados más completos posibles.

El primer dato global es que, en realidad, muy pocas empresas han adoptado alguna metodología de análisis de datos masivos. Se puede decir, por tanto, que aún se está en fase de adopción de estas tecnologías. Sólo 2.680 empresas de las analizadas están usando Hadoop, de las cuales 1.636 lo hacen de forma casi embrionaria, analizando datos básicos. 552 ya está en una fase más avanzada analizando grandes volúmenes de datos, frente al 492 que ya estarían en una fase muy avanzada, experimentando y desarrollando su propia metodología. En cuanto al uso de Apache Spark se encontraron cerca de 2.000 empresas que han optado por su tecnología, si bien sólo 67 de ellas lo hacen a un nivel muy avanzado.

Las grandes empresas con más de 5.000 empleados son las que están llevando a cabo más rápidamente análisis de Big Data con Hadoop. Las pequeñas y más jóvenes tardan más, a pesar de nacer en entornos de aplicación de última tecnología para empresas. De hecho, la mayoría de éstas que sí trabajan con Hadoop o similar son precisamente compañías tecnológicas. En general, además de las tecnológicas, las empresas de productos financieros son las que más uso hacen del Big Data; ni farmacéuticas ni petroleras, sorprendentemente, destacan en este campo.

Un aspecto importante al hablar de datos es el de la seguridad y el fraude. Según el informe, un tercio de la inversión presupuestada en Big Data se dedica a la prevención del riesgo de fraude. Una media alta en comparación con la inversión general en análisis de datos.

En cuanto al aspecto laboral, los principales usuarios de estas tecnologías son los que ocupan puestos de ingenieros, con una tendencia muy acusada de estudiantes que quieren dirigir sus carreras en este sentido: el 59% de los usuarios de análisis de datos tienen estudios superiores. Sólo en LinkedIn y en perfiles de Estados Unidos se descubrió la demanda de 5.000 puestos de trabajo para personas con habilidades en el análisis de datos masivos. Las compañías de servicios financieros, de nuevo, son las que más puestos de trabajo dedican a esta labor.

Como vemos, lejos se está aún en el sector cultural de aparecer entre las compañías que hacen uso de análisis masivos de datos. Es de esperar que no va a ser así siempre, porque, como hemos visto en varias ocasiones, todo indica que los Big Data van a ser parte fundamental de las empresas e instituciones de toda naturaleza.

Leave a Reply