Cuadrante Mágico para plataformas de Análisis Predictivo (Data Science antes Advanced Analytics)

Antes se le denominaba Advanced Analytics ahora Data Science, en ambos casos nos referimos a herramientas de Análisis Predictivo, Minería de datos, Estadística y Exploración. A partir de este año el informe de la consultora Gartner se denomina Magic Quadrant for Data Science Platforms (hasta el año pasado se conocía como Magic Quadrant for Advanced Analytics Platforms). Este es otros de los cuadrantes de Gartner de nuestro interés.


Antes se le denominaba Advanced Analytics  ahora Data Science, en ambos casos nos referimos a herramientas de Análisis Predictivo, Minería de datos, Estadística y Exploración. A partir de este año el informe de la consultora Gartner se denomina Magic Quadrant for Data Science Platforms (hasta el año pasado se conocía como Magic Quadrant for Advanced Analytics Platforms). Este es otros de los cuadrantes de Gartner de nuestro interés.

magic-quadrant-for-data-science-platforms

Este informe no incluye herramientas de código abierto tales como R o Python, dado que no hay un fabricante exclusivo que las ofrezca, esta situación no encaja con la filosofía de la elaboración de este estudio.

Este estudio incluye, a los que Gartner considera, 16 principales fabricantes en este sector, del que se estima existan más de 100 proveedores, a los cuales se evalúan, entre otras, los siguientes aspectos:

  • Amplitud de posibilidades de acceso a datos (local y en la nube) y tipo (texto, transaccional, audio, imágenes, localización, series de tiempo, etc).
  • Posibilidades de preparación de datos.
  • Exploración de datos y visualización interactiva.
  • Opciones de automatización
  • Interfaz de usuario.
  • Aprendizaje automático o Aprendizaje de máquina (Machine learning).
  • Otras posibilidades de análisis avanzado. Tales como análisis de texto e imágenes
  • Flexibilidad y extensibilidad. Posibilidades de creación de funciones específicas.
  • Rendimiento y escalabilidad
  • Plataforma y gestión de proyectos
  • Soluciones predefinidas
  • Colaboración
  • Coherencia de plataforma

Lo que se dice en el informe sobre SAP

  • La propuesta Plataforma Científica de Datos (Data Science Platform)  se denomina SAP BusinessObjects Predictive Analytics (BOPA), este informe no incluye a SAP BusinessObjects BI, ni SAP Lumira, los cuales tienen algunas posibilidades de este tipo de herramientas.
  • Para Gartner, SAP ha perdido capacidades al no incluir posibilidades con Spark integration (alternativa de Hadoop para procesar grandes volúmenes de datos), por brindar poca integración con código abierto, Python, y su pobre despliegue en la nube.Se señala como fortaleza su integración con SAP HANA para obtener las posibilidades más avanzadas, pero al mismo tiempo se señala como una preocupación esta dependencia, lo que resulta un impedimento para empresas que no utilizan HANA como base de datos.
  • Así mismos, Gartner señala, lo que consideramos un problema de Marketing, más que técnico, nos referimos al bajo posicionamiento que tiene SAP en este sector (mind share), al ser considerado por los clientes como un proveedor no especializado. Tal vez SAP debió mantener el nombre de KXEN, plataforma que adquirió en octubre de 2013 y contaba con una trayectoria más reconocida en este exigente sector. Nos preguntamos ¿ahora que Gartner abandona el término Advanced Analytics, SAP cambiará el nombre a su producto?

Fuzzifiquemos el Análisis de datos (Lógica Difusa – Fuzzy Logic)

La lógica binaria ha demostrado no ser lo más indicado para el análisis de datos, sobre todo cuando se está tratando datos de naturaleza tan ambigua y dispersa como los que están asociados a las personas, llámese clientes, colaboradores, proveedores, empresas, etc. Asignarle un valor único, tal como un cero o un uno (o verdadero/falso o blanco/negro o grande/pequeño,…) a una determinada característica en un mundo que tiene una amplia variedad de matices, puede ser de poca utilidad o conllevar a tomar las decisiones menos adecuadas.


La lógica binaria ha demostrado no ser lo más indicado para el análisis de datos, sobre todo cuando se está tratando datos de naturaleza tan ambigua y dispersa como los que están asociados a las personas, llámese clientes, colaboradores, proveedores, empresas, etc. Asignarle un valor único, tal como un cero o un uno (o verdadero/falso o blanco/negro o grande/pequeño,…) a una determinada característica en un mundo que tiene una amplia variedad de matices, puede ser de poca utilidad o conllevar a tomar las decisiones menos adecuadas.

En nuestras implementaciones de Business Intelligence o Business Analytics deberíamos tender a ofrecer un análisis de datos similar al que se logra con el razonamiento humano, es aquí donde la “Lógica difusa” (Fuzzy Logic) debería tenerse presente. No se trata de un nuevo concepto, fue introducido en 1965, pero es de estos conceptos resucitados y potenciados ahora por las mejoras en la capacidad de procesamiento y por la necesidad de lograr sistemas más útiles en un nuevo contexto con mayor incertidumbre.

Como señala el artículo de referencia, “la lógica difusa se aplica en una amplia variedad de campos relacionados, directa o indirectamente, con la comprensión de la información. Las técnicas de lógica difusa permiten estudiar los datos desde la ambigüedad del propio lenguaje, es decir, comprenderlos como los comprenderían las personas”. La lógica difusa extiende la lógica binaria para ofrecer un abanico de respuestas o valores que puede ser asignado a un elemento que se contendría entre lo completamente cierto y lo completamente falso (Ref. Wikipedia).

Por ejemplo, en la clasificación, segmentación o catalogación de elementos, siguiendo procedimiento clásicos, se concluye en la asignación de los elementos a un segmento en concreto, pero la realidad no siempre es tan clara o exacta porque un mismo elemento puede pertenecer a más de un segmento. Utilizando técnicas de “fuzzy” (fuzzy clustering) se podría identificar la pertenencia de los elementos a los distintos segmentos identificados e inclusive, se podría lograr obtener su grado de pertenencia a cada segmento.

En teoría, todo o casi todo se podría “fuzzificar”, lamentablemente hay pocas herramientas de minería de datos que brinden esta capacidad de procesamiento (ver la propuesta de Matlab), pero conociendo la técnica podríamos lograr resultados más útiles para la toma de decisiones.

Referencia: Harvard Deusto (Nro. 234. Artículo “El gran potencial de la lógica difusa” de Mónica Casabayó y Núria Agell)

Novedades en SAP InfiniteInsight 7.0

SAP InfiniteInsight es una de las dos principales soluciones de Análisis Predictivo del portfolio de SAP Predictive Analytics que recientemente ha tenido una actualización. La 7.0 es la primera actualización de este producto que se integró a la familia SAP luego de la adquisición de la empresa KXEN. Según los primeros planes de futuro de SAP, el producto de KXEN se integraría al producto desarrollado por SAP, denominado Predictive Analysis para ofrecer una única solución de Minería de datos y Predicción.


SAP InfiniteInsight es una de las dos principales soluciones de Análisis Predictivo del portfolio de SAP Predictive Analytics que recientemente ha tenido una actualización. La 7.0 es la primera actualización de este producto que se integró a la familia SAP luego de la adquisición de la empresa KXEN. Según los primeros planes de futuro de SAP, el producto de KXEN se integraría al producto desarrollado por SAP, denominado Predictive Analysis para ofrecer una única solución de Minería de datos y Predicción.

SAP InfiniteInsight solutions

Mientras tanto, la nueva actualización de InfiniteInsight ofrece las siguientes novedades:

  • Se incorpora capacidades de Geolocalización para la construcción de modelos. Se podría utilizar datos sobre latitud y longitud para definir una variable de posición.
  • Brinda herramientas para consultar modelos con variables de posición. Modelos que podrían ayudar a identificar rutas/secuencias más comunes, identificación de personas en la misma posición (Colocation).
  • A través de DataDirect 7.1 SP3 se brinda soporte a bases de datos HADOOP Hive 11 y 12 y Greenplum Database 4.2. Este mismo conector mejora la conectividad con Oracle y Teradata.
  • En cuanto a la interfaz, se han rediseñado informes, paneles e iconos para mejorar la experiencia del usuario.
  • Las Variables Compuestas es otra novedad de InfiniteInsight 7.0 la cual permite cruzar múltiples variables a la vez, combinando dos o más indicadores en una sola medida.

Referencia: SAP Blogs

Notas para la instalación de SAP InfiniteInsight

Desde el mes de noviembre está disponible la descarga de los instaladores de SAP InfiniteInsiht, principal producto de KXEN, compañía que compró SAP en último trimestre de 2013. InfiniteInsight es una herramienta de diseño de modelos predictivos. Según los planes de SAP (aquí post relacionado), SAP Predictive Analysis y InfiniteInsight, se consolidarán en una única solución.


Desde el mes de noviembre está disponible la descarga de los instaladores de SAP InfiniteInsight, principal producto de KXEN, compañía que compró SAP en último trimestre de 2013.  InfiniteInsight es una herramienta de diseño de modelos predictivos. Según los planes de SAP (aquí post relacionado), SAP Predictive Analysis y InfiniteInsight, se consolidarán en una única solución.

II Instalador

La instalación de InfiniteInsight no tiene ninguna complejidad, con la selección por defecto de los componentes a instalar, será suficiente.  Quizás la selección del componente “COM Library” pueda parecer interesante para el desarrollo de proyectos Visual Basic.

Pantalla inicial de SAP InfiniteInsight 6.5.4

La documentación en formato PDF se encuentra en el paquete de instalación, la cual se copia en la carpeta de instalación del producto. Adicionalmente, podría ser necesario consultar las siguientes notas:

SAP presenta su roadmap de soluciones de Análisis Predictivo

Con la compra de KXEN por parte de SAP, el panorama de su porfolio Predictive Analysis o Análisis Predictivo, estaba totalmente nublado. Con la publicación de la primera versión del roadmap “SAP Predictive Analysis and SAP InfiniteInsight” se aporta cierta claridad, quedando por esclarecer, la alianza estratégica que recientemente anuncio SAP con SAS.


Con la compra de KXEN por parte de SAP,  el panorama de su porfolio Predictive Analysis o Análisis Predictivo, estaba totalmente nublado.  Con la publicación de la primera versión del roadmap “SAP Predictive Analysis and SAP InfiniteInsight” se aporta cierta claridad, quedando por esclarecer, la alianza estratégica que recientemente anuncio SAP con SAS.

Adaptación del portfolio KXEN a productos SAP

Un roadmap debe ser visto como una declaración de intenciones, la cual puede estar sujeta a ciertas modificaciones, pero en principio, da a conocer los pilares sobre la que se estructurará la evolución o próximos cambios de un portfolio. El conocimiento de un roadmap es importante para los usuarios para que puedan planificar sus próximas inversiones en tecnologías de la información.

Visión de una plataforma de análisis predictivo completa

La denominación de este roadmap recibe el nombre de las dos aplicaciones que coexistirán para cubrir diversas necesidades Estadísticas y de Minería de Datos. SAP Predictive Analysis es la aplicación desarrollada por SAP y SAP InfiniteInsight  es el principal producto de KXEN. Contra lo que en principio se presuponía, SAP Predictive Analysis no desaparecerá, este producto terminará absorbiendo todos los módulos y funcionalidades de los productos de KXEN.

Planes de integracion de KXEN InfiniteInsight en SAP Predictive Analysis

El panorama final será amplio, a largo plazo las funcionalidades y módulo de InfiniteInsight serán integradas en Predictive Analysis, Lumira (antes Visual Intelligence) y SAP HANA, lo cual dará lugar a la creación de una nueva librería HANA (InfiniteInsight function library – “IFL” – for SAP HANA).  El mensaje de futuro es claro, “si quieres incorporar capacidades predictivas a tu negocio, piensa en HANA o en las alternativas de Sybase IQ o Teradata 14.1”

Plan global de los dos productos del porfolio de Análisis Predictivo

El análisis predictivo de SAP vuelve a “nacer”, pero los que hicieron inversiones en SAP Predictive Analysis, por el momento, pueden estar tranquilos, su inversión no se ha perdido, y en el futuro tendrán  a su disposición actualizaciones de una aplicación mucho más completa.