Archivo de la etiqueta: Predictive Analysis

Cuadrante Mágico para plataformas de Análisis Predictivo (Data Science antes Advanced Analytics)


Antes se le denominaba Advanced Analytics  ahora Data Science, en ambos casos nos referimos a herramientas de Análisis Predictivo, Minería de datos, Estadística y Exploración. A partir de este año el informe de la consultora Gartner se denomina Magic Quadrant for Data Science Platforms (hasta el año pasado se conocía como Magic Quadrant for Advanced Analytics Platforms). Este es otros de los cuadrantes de Gartner de nuestro interés.

magic-quadrant-for-data-science-platforms

Este informe no incluye herramientas de código abierto tales como R o Python, dado que no hay un fabricante exclusivo que las ofrezca, esta situación no encaja con la filosofía de la elaboración de este estudio.

Este estudio incluye, a los que Gartner considera, 16 principales fabricantes en este sector, del que se estima existan más de 100 proveedores, a los cuales se evalúan, entre otras, los siguientes aspectos:

  • Amplitud de posibilidades de acceso a datos (local y en la nube) y tipo (texto, transaccional, audio, imágenes, localización, series de tiempo, etc).
  • Posibilidades de preparación de datos.
  • Exploración de datos y visualización interactiva.
  • Opciones de automatización
  • Interfaz de usuario.
  • Aprendizaje automático o Aprendizaje de máquina (Machine learning).
  • Otras posibilidades de análisis avanzado. Tales como análisis de texto e imágenes
  • Flexibilidad y extensibilidad. Posibilidades de creación de funciones específicas.
  • Rendimiento y escalabilidad
  • Plataforma y gestión de proyectos
  • Soluciones predefinidas
  • Colaboración
  • Coherencia de plataforma

Lo que se dice en el informe sobre SAP

  • La propuesta Plataforma Científica de Datos (Data Science Platform)  se denomina SAP BusinessObjects Predictive Analytics (BOPA), este informe no incluye a SAP BusinessObjects BI, ni SAP Lumira, los cuales tienen algunas posibilidades de este tipo de herramientas.
  • Para Gartner, SAP ha perdido capacidades al no incluir posibilidades con Spark integration (alternativa de Hadoop para procesar grandes volúmenes de datos), por brindar poca integración con código abierto, Python, y su pobre despliegue en la nube.Se señala como fortaleza su integración con SAP HANA para obtener las posibilidades más avanzadas, pero al mismo tiempo se señala como una preocupación esta dependencia, lo que resulta un impedimento para empresas que no utilizan HANA como base de datos.
  • Así mismos, Gartner señala, lo que consideramos un problema de Marketing, más que técnico, nos referimos al bajo posicionamiento que tiene SAP en este sector (mind share), al ser considerado por los clientes como un proveedor no especializado. Tal vez SAP debió mantener el nombre de KXEN, plataforma que adquirió en octubre de 2013 y contaba con una trayectoria más reconocida en este exigente sector. Nos preguntamos ¿ahora que Gartner abandona el término Advanced Analytics, SAP cambiará el nombre a su producto?
Anuncios

Fuzzifiquemos el Análisis de datos (Lógica Difusa – Fuzzy Logic)


La lógica binaria ha demostrado no ser lo más indicado para el análisis de datos, sobre todo cuando se está tratando datos de naturaleza tan ambigua y dispersa como los que están asociados a las personas, llámese clientes, colaboradores, proveedores, empresas, etc. Asignarle un valor único, tal como un cero o un uno (o verdadero/falso o blanco/negro o grande/pequeño,…) a una determinada característica en un mundo que tiene una amplia variedad de matices, puede ser de poca utilidad o conllevar a tomar las decisiones menos adecuadas.

En nuestras implementaciones de Business Intelligence o Business Analytics deberíamos tender a ofrecer un análisis de datos similar al que se logra con el razonamiento humano, es aquí donde la “Lógica difusa” (Fuzzy Logic) debería tenerse presente. No se trata de un nuevo concepto, fue introducido en 1965, pero es de estos conceptos resucitados y potenciados ahora por las mejoras en la capacidad de procesamiento y por la necesidad de lograr sistemas más útiles en un nuevo contexto con mayor incertidumbre.

Como señala el artículo de referencia, “la lógica difusa se aplica en una amplia variedad de campos relacionados, directa o indirectamente, con la comprensión de la información. Las técnicas de lógica difusa permiten estudiar los datos desde la ambigüedad del propio lenguaje, es decir, comprenderlos como los comprenderían las personas”. La lógica difusa extiende la lógica binaria para ofrecer un abanico de respuestas o valores que puede ser asignado a un elemento que se contendría entre lo completamente cierto y lo completamente falso (Ref. Wikipedia).

Por ejemplo, en la clasificación, segmentación o catalogación de elementos, siguiendo procedimiento clásicos, se concluye en la asignación de los elementos a un segmento en concreto, pero la realidad no siempre es tan clara o exacta porque un mismo elemento puede pertenecer a más de un segmento. Utilizando técnicas de “fuzzy” (fuzzy clustering) se podría identificar la pertenencia de los elementos a los distintos segmentos identificados e inclusive, se podría lograr obtener su grado de pertenencia a cada segmento.

En teoría, todo o casi todo se podría “fuzzificar”, lamentablemente hay pocas herramientas de minería de datos que brinden esta capacidad de procesamiento (ver la propuesta de Matlab), pero conociendo la técnica podríamos lograr resultados más útiles para la toma de decisiones.

Referencia: Harvard Deusto (Nro. 234. Artículo “El gran potencial de la lógica difusa” de Mónica Casabayó y Núria Agell)

Novedades en SAP InfiniteInsight 7.0


SAP InfiniteInsight es una de las dos principales soluciones de Análisis Predictivo del portfolio de SAP Predictive Analytics que recientemente ha tenido una actualización. La 7.0 es la primera actualización de este producto que se integró a la familia SAP luego de la adquisición de la empresa KXEN. Según los primeros planes de futuro de SAP, el producto de KXEN se integraría al producto desarrollado por SAP, denominado Predictive Analysis para ofrecer una única solución de Minería de datos y Predicción.

SAP InfiniteInsight solutions

Mientras tanto, la nueva actualización de InfiniteInsight ofrece las siguientes novedades:

  • Se incorpora capacidades de Geolocalización para la construcción de modelos. Se podría utilizar datos sobre latitud y longitud para definir una variable de posición.
  • Brinda herramientas para consultar modelos con variables de posición. Modelos que podrían ayudar a identificar rutas/secuencias más comunes, identificación de personas en la misma posición (Colocation).
  • A través de DataDirect 7.1 SP3 se brinda soporte a bases de datos HADOOP Hive 11 y 12 y Greenplum Database 4.2. Este mismo conector mejora la conectividad con Oracle y Teradata.
  • En cuanto a la interfaz, se han rediseñado informes, paneles e iconos para mejorar la experiencia del usuario.
  • Las Variables Compuestas es otra novedad de InfiniteInsight 7.0 la cual permite cruzar múltiples variables a la vez, combinando dos o más indicadores en una sola medida.

Referencia: SAP Blogs

Notas para la instalación de SAP InfiniteInsight


Desde el mes de noviembre está disponible la descarga de los instaladores de SAP InfiniteInsight, principal producto de KXEN, compañía que compró SAP en último trimestre de 2013.  InfiniteInsight es una herramienta de diseño de modelos predictivos. Según los planes de SAP (aquí post relacionado), SAP Predictive Analysis y InfiniteInsight, se consolidarán en una única solución.

II Instalador

La instalación de InfiniteInsight no tiene ninguna complejidad, con la selección por defecto de los componentes a instalar, será suficiente.  Quizás la selección del componente “COM Library” pueda parecer interesante para el desarrollo de proyectos Visual Basic.

Pantalla inicial de SAP InfiniteInsight 6.5.4

La documentación en formato PDF se encuentra en el paquete de instalación, la cual se copia en la carpeta de instalación del producto. Adicionalmente, podría ser necesario consultar las siguientes notas:

SAP presenta su roadmap de soluciones de Análisis Predictivo


Con la compra de KXEN por parte de SAP,  el panorama de su porfolio Predictive Analysis o Análisis Predictivo, estaba totalmente nublado.  Con la publicación de la primera versión del roadmap “SAP Predictive Analysis and SAP InfiniteInsight” se aporta cierta claridad, quedando por esclarecer, la alianza estratégica que recientemente anuncio SAP con SAS.

Adaptación del portfolio KXEN a productos SAP

Un roadmap debe ser visto como una declaración de intenciones, la cual puede estar sujeta a ciertas modificaciones, pero en principio, da a conocer los pilares sobre la que se estructurará la evolución o próximos cambios de un portfolio. El conocimiento de un roadmap es importante para los usuarios para que puedan planificar sus próximas inversiones en tecnologías de la información.

Visión de una plataforma de análisis predictivo completa

La denominación de este roadmap recibe el nombre de las dos aplicaciones que coexistirán para cubrir diversas necesidades Estadísticas y de Minería de Datos. SAP Predictive Analysis es la aplicación desarrollada por SAP y SAP InfiniteInsight  es el principal producto de KXEN. Contra lo que en principio se presuponía, SAP Predictive Analysis no desaparecerá, este producto terminará absorbiendo todos los módulos y funcionalidades de los productos de KXEN.

Planes de integracion de KXEN InfiniteInsight en SAP Predictive Analysis

El panorama final será amplio, a largo plazo las funcionalidades y módulo de InfiniteInsight serán integradas en Predictive Analysis, Lumira (antes Visual Intelligence) y SAP HANA, lo cual dará lugar a la creación de una nueva librería HANA (InfiniteInsight function library – “IFL” – for SAP HANA).  El mensaje de futuro es claro, “si quieres incorporar capacidades predictivas a tu negocio, piensa en HANA o en las alternativas de Sybase IQ o Teradata 14.1”

Plan global de los dos productos del porfolio de Análisis Predictivo

El análisis predictivo de SAP vuelve a “nacer”, pero los que hicieron inversiones en SAP Predictive Analysis, por el momento, pueden estar tranquilos, su inversión no se ha perdido, y en el futuro tendrán  a su disposición actualizaciones de una aplicación mucho más completa.

Propuesta de Análisis Predictivo de SAP en restructuración


SAP no se ha conformado con la adquisición de KXEN para reestructurar su propuesta de Análisis Predictivo y Minería de Datos, una nueva y transcendente medida se suma en esta línea, se trata del acuerdo de colaboración con SAS Institute la compañía líder de este sector del Business Analytics/Data Mining.

La finalidad de la alianza de SAP con SAS es lograr el funcionamiento más óptimo de los productos y soluciones de SAS Institute sobre plataformas SAP HANA y desarrollar una propuesta comercial conjunta de procesamiento en memoria y Big Data.  Hoy por hoy, sobre la propuesta de Análisis Predictivo de SAP identificamos los siguientes hechos relevantes:

  • Nueva adquisición de KXEN
  • Alianza estratégica con SAS Institute
  • Uso de SAP HANA como plataforma
  • Futuro de SAP Predictive Analysis (aplicación desarrollada a inicios de año por SAP)

Para muchos, falta claridad o una visión conjunta que explique los planes de futuro que tiene SAP para utilizar soluciones de minería de datos para la gestión de los negocios.  Una alternativa para conocer los próximos pasos de SAP es el webinar del 4 de noviembre que bridarán los responsables de soluciones Predictive Analytics.

Referencias: SAS.com, SAP.com y enlace para Webinar

KXEN ya luce logotipo como una “SAP Company”


Percibíamos pequeñas dudas por el anuncio del 10 de septiembre sobre la intención de compra de KXEN por parte de SAP , porque el comunicado sólo fue dado por la parte de SAP.  Recién el 1 de octubre hemos leído la confirmación del anuncio por ambas partes.  En el caso de KXEN ha sido el CEO  de esta compañía el que ha anunciado que KXEN es un nueva compañía SAP.

KXEN estrena logotipo como una SAP Company

Con este nuevo anuncio asumimos que KXEN tendrá un tratamiento similar al que tuvo Sybase cuando fue comprada por SAP, respetando su personalidad, manteniendo la imagen de marca y brindándole cierta independencia.  Esta unión permitirá combinar la potencia de cálculo y almacenamiento de SAP HANA y los algoritmos y facilidad de uso que tienen los productos KXEN

Con esta adquisición SAP considera que tendrá argumentos suficientes para competir contra IBM (con SPSS) y SAS, las compañías líderes en minería de datos y análisis predictivo, que juntas logran el 50% de cuota de mercado de este sector.  SAP también señala que aspira a incluir la capacidad de KXEN en todos sus productos. El siguiente paso de SAP será la restructuración de toda su propuesta comercial y de producto de la cartera de Análisis Predictivo.

Referencias: Anuncio KXEN y Anuncio SAP

Dragons Kings vs. Black Swans (Dragones Reyes contra Cisnes Negros / predictibilidad si o predictibilidad no)


Hemos escrito algunas entradas sobre la obra de Nassim Nicholas Taleb sobre la teoría de “El Cisne Negro”, el cual señala que puede producirse en cualquier momento “hechos raros”, imposibles de predecir, cuyo impacto puede llegar a ser importante y de considerables proporciones, pero desconocíamos que existiera una teoría totalmente opuesta, la de los Dragones Reyes (Dragons Kings) la cual señala que casi todos los hechos son predecibles, teniendo en Didier Sornette su máximo defensor, el cual defiende su concepto del siguiente modo:

Los denominados “Dragons Kings” representan eventos extremos que son de una clase particular que aparecen repentinamente y destroza la creencia que todos los cisnes son blancos; refleja la idea de imprevisibilidad, de desconocimiento, de que los acontecimientos extremos son fundamentalmente incognoscibles.

Nada puede ser más alejado del concepto de “Dragón Rey” que propongo, que es exactamente lo contrario, los fenómenos más extremos son realmente cognoscibles y predecibles.  Así que podemos sentirnos autorizados, asumir la responsabilidad y hacer predicciones sobre los hechos…. Hagamos que mi “Dragón Rey” desaparezca el concepto del “Cisne Negro”.

De la presentación anterior, sobre la predictibilidad de los hechos, extraemos estas otras frases:

  • Gobernar es el arte de la planificación y la predicción
  • La mayoría de los sistemas tienen algo de previsibilidad
  • Es posible desarrollar diagnósticos anticipados de las crisis para estar preparados para poder tomar medidas y asumir responsabilidades.

Nuestra Opinión

Cuando no se sabe algo se suele negar su validez o utilidad, es lo más fácil o cómodo. Algo similar a sucedido con la minería de datos y el análisis predictivo desde siempre.  La minería de datos o data mining requiere cierto conocimiento técnico, especialmente estadístico (por lo visto, no muy fácil de encontrar).  Esta carencia de conocimiento técnico aunado a la complejidad de la mayoría de las herramientas de minería de datos que los fabricantes han desarrollado hasta ahora, ha conducido a lograr muy bajos índices de adopción de esta tecnología en la gestión de las empresas.

SAP, con Predictive Analysis dio un paso importante en la minería datos, pero no lo suficientemente transcendente como para ampliar considerablemente la predictibilidad como estilo de gestión.  Este paso importante tendría lugar si se llegase a concretar la compra de KXEN, una plataforma Data Mining con una amplia trayectoria y una completa gama de soluciones para los negocios, que se caracterizan por la facilidad de uso, principal barrera que han encontrado los usuarios de otros productos. KXEN acoplado a la capacidad de procesamiento de SAP HANA sería la arquitectura perfecta para gestionar los negocios adelantándose a los hechos.

Al fin,… SAP compraría KXEN… (lo pedíamos desde el 2011)


KXEN (Knowledge eXtraction ENgines) es una plataforma de minería de datos y análisis predictivo, que personalmente “descubrimos” a mediados de 2011, pero se trata de una empresa con sede en San Francisco (EEUU) con una larga trayectoria y una amplia gama de soluciones que se caracterizan por la construcción de modelos predictivos con mucha facilidad con relación a propuestas similares de otros fabricantes.

KXEN tiene como clientes a las principales grandes empresas del mundo, casi la totalidad de las incluidas en Fortune 500 (las 500 mayores empresas de EEUU), por este este factor,  aunado a la amplia gama de robustas y amigables soluciones, nos preguntábamos por qué SAP no compraba esta empresa cuando carecía totalmente de una solución propia con estas características (incluimos esta “sugerencia” en nuestra lista de deseos de 2012).

Al parecer, la compra de KXEN por parte de SAP se concretaría a finales de este 2013, pero ahora surgen dudas de lo que sucederá con SAP Predictive Analysis (PA), el “invento” de SAP que no tiene más de un año de vida, que se presentaba, hasta ahora, como la propuesta para diseñar modelos predictivos.  El mensaje que recibiremos por parte de SAP será que habrá continuidad para PA, pero personalmente sugerimos que esté atento a las próximas noticias.  Estimamos, que como todo indica, la compra de KXEN se concretará y esta plataforma será la columna vertebral de las soluciones de minería de datos y análisis predictivo que se acoplará, en muy breve tiempo a SAP HANA y las soluciones de los portofolios SAP BusinesObjects BI y SAP EPM (Enterprise Performance Management, la cual incluye SAP BPC).

No deseamos”aguar la fiesta” que significa esta noticia, de la personalmente nos alegramos mucho, pero percibimos más euforia por parte de SAP, que de KXEN.  En otras ocasiones, ambas partes comunicaban en la misma línea y en esta ocasión sólo vemos comunicados por parte de SAP sobre estas negociaciones.

Por último, nos preguntamos si este importante paso que ha dado SAP desencadenaría  alguna reacción en la competencia, tal vez la venta de SAS, otro líder de la minería de datos, que se rumoreó hace algunos años se concretaría, sea cual fuere la reacción de cualquier otro fabricante, SAP ya ganó, al llevarse la mejor plataforma predictiva, así lo dicen los innumerables reconocimientos que tiene KXEN en su campo.

Referencia: Aquí nuestros posts sobre KXEN

En la revista SAP Club


El logro de ventajas competitivas o valor para la organización, se obtendrá cunado se haga algo diferente al resto, adoptar SAP HANA y esperar que su capacidad y velocidad de procesamiento, por si solos, obren el milagro, sería engañarnos.  Todo aquello que puede ser comprado por nosotros y el resto, no brinda “ventajas competitivas” a nadie.  En el caso de las tecnologías, las ventajas con respecto a la competencia se logran en el modo en que se adoptan y el uso que se le da.

Para nosotros, SAP HANA es una fuente generadora de ventajas competitivas infinita, al permitir realizar tareas que siempre han estado limitadas o vetadas por la capacidad de procesamiento de los sistemas.  Como es el caso del análisis predictivo, el cual bien implementado y adoptado como complemento en los procesos de negocio, es el mejor modo de obtener el máximo beneficio de una inversión en SAP HANA.

Tenemos la plataforma (SAP HANA), contamos con las herramientas (encabezadas por SAP Predictive Analysis), sólo falta que las organizaciones adopten la filosofía predictiva para adelantarse a las oportunidades y evitar/minimizar los riesgos.  Esta es la idea que conjuntamente con Single Consulting hemos tratado de plasmar en 6.000 caracteres en la revista SAP Club, en su edición cuatrimestral de julio 2013, número 45.  Gracias! Single, una consultora diferente.

Referencia: Revista SAP Club o en formato PDF