¿Qué es la Analítica Aumentada? (augmented analytics) #GartnerABI 01

La Analítica Aumenta o Augmented Analytics es uno de los términos más utilizados en el reciente informe de Gartner sobre las plataformas de Business Intelligence (BI) y Analytics 2020, más conocido como “Magic Quadrant for Analytics and Business Intelligence Platforms”.


En este informe se señala que la Analítica Aumentada es uno de los principales elementos diferenciadores, con mayor potencial de crecimiento y despliegue en las propuestas de los principales fabricantes de software analítico. Pero que no necesariamente, todo este crecimiento, irá de la mano con la capacidad de consumo de los usuarios, tal es así, que Gartner predice que para 2022 estas capacidades analíticas serán omnipresentes, pero sólo el 10% de los analistas utilizará todo su potencial.

¿Pero en qué consiste la Analítica Aumenta?

Para definir correctamente este término nos basamos en dos fuentes, por un lado, de Gartner, el cual afirma lo siguiente:

La analítica aumentada es el uso de tecnologías habilitadoras como el aprendizaje automático (machine learning) y la inteligencia artificial (AI) para apoyar la preparación de los datos, generación de conocimiento y la explicación de la información para potenciar la forma en que las personas exploran y analizan datos en las plataformas de análisis y BI. 

Otra referencia es la que encontramos en el siguiente vídeo:

Conclusión

El Augmented Analytics incluirá en las plataformas de Análisis y BI una serie de funcionalidades para facilitar la interacción de los usuarios con la plataforma o herramienta de análisis y obtener datos de mayor calidad y fiabilidad. Se augura que en algún día nos podamos comunicar con las soluciones o “máquinas” de análisis tal como si fuera otro humano y obtener respuestas útiles e inmediatas.

Pero, ¿por qué es tan negativo Gartner al señalar que sólo el 10%  utilizará todo el potencial de la Analítica Aumentada en 2022? Consideramos que este “pesimismo” obedece a que deberá darse una curva de aprendizaje y, sobre todo, porque todo lo que conlleva estas funcionalidades no son nuevas, la novedad está en incluirlas, de forma armónica, en un producto.

Estamos hablando de tecnologías tales como la inteligencia artificial, aprendizaje automático, procesamiento de lenguaje natural, minería de datos o estadística. A mi parecer, si estas técnicas “veteranas” no se han utilizado tanto, como debería ser, en soluciones de análisis, es porque cada una de las partes “hablan de su libro”, por un lado, los técnicos y consultores no aparcan en su discurso sus “técnicas” y “algoritmos”. Y, por otro lado, los usuarios desean hablar de los “procesos clave de su negocio”, y es aquí dónde nos debemos centrar, para identificar con claridad la visión, objetivos del análisis y, en consecuencia, identificar la arquitectura de datos que se requiere.

Cuadrante Mágico para plataformas de Análisis Predictivo (Data Science antes Advanced Analytics)

Antes se le denominaba Advanced Analytics ahora Data Science, en ambos casos nos referimos a herramientas de Análisis Predictivo, Minería de datos, Estadística y Exploración. A partir de este año el informe de la consultora Gartner se denomina Magic Quadrant for Data Science Platforms (hasta el año pasado se conocía como Magic Quadrant for Advanced Analytics Platforms). Este es otros de los cuadrantes de Gartner de nuestro interés.


Antes se le denominaba Advanced Analytics  ahora Data Science, en ambos casos nos referimos a herramientas de Análisis Predictivo, Minería de datos, Estadística y Exploración. A partir de este año el informe de la consultora Gartner se denomina Magic Quadrant for Data Science Platforms (hasta el año pasado se conocía como Magic Quadrant for Advanced Analytics Platforms). Este es otros de los cuadrantes de Gartner de nuestro interés.

magic-quadrant-for-data-science-platforms

Este informe no incluye herramientas de código abierto tales como R o Python, dado que no hay un fabricante exclusivo que las ofrezca, esta situación no encaja con la filosofía de la elaboración de este estudio.

Este estudio incluye, a los que Gartner considera, 16 principales fabricantes en este sector, del que se estima existan más de 100 proveedores, a los cuales se evalúan, entre otras, los siguientes aspectos:

  • Amplitud de posibilidades de acceso a datos (local y en la nube) y tipo (texto, transaccional, audio, imágenes, localización, series de tiempo, etc).
  • Posibilidades de preparación de datos.
  • Exploración de datos y visualización interactiva.
  • Opciones de automatización
  • Interfaz de usuario.
  • Aprendizaje automático o Aprendizaje de máquina (Machine learning).
  • Otras posibilidades de análisis avanzado. Tales como análisis de texto e imágenes
  • Flexibilidad y extensibilidad. Posibilidades de creación de funciones específicas.
  • Rendimiento y escalabilidad
  • Plataforma y gestión de proyectos
  • Soluciones predefinidas
  • Colaboración
  • Coherencia de plataforma

Lo que se dice en el informe sobre SAP

  • La propuesta Plataforma Científica de Datos (Data Science Platform)  se denomina SAP BusinessObjects Predictive Analytics (BOPA), este informe no incluye a SAP BusinessObjects BI, ni SAP Lumira, los cuales tienen algunas posibilidades de este tipo de herramientas.
  • Para Gartner, SAP ha perdido capacidades al no incluir posibilidades con Spark integration (alternativa de Hadoop para procesar grandes volúmenes de datos), por brindar poca integración con código abierto, Python, y su pobre despliegue en la nube.Se señala como fortaleza su integración con SAP HANA para obtener las posibilidades más avanzadas, pero al mismo tiempo se señala como una preocupación esta dependencia, lo que resulta un impedimento para empresas que no utilizan HANA como base de datos.
  • Así mismos, Gartner señala, lo que consideramos un problema de Marketing, más que técnico, nos referimos al bajo posicionamiento que tiene SAP en este sector (mind share), al ser considerado por los clientes como un proveedor no especializado. Tal vez SAP debió mantener el nombre de KXEN, plataforma que adquirió en octubre de 2013 y contaba con una trayectoria más reconocida en este exigente sector. Nos preguntamos ¿ahora que Gartner abandona el término Advanced Analytics, SAP cambiará el nombre a su producto?

SAP Lumira, sólo para sistemas operativos de 64 bits (o SAP BusinessObjects Lumira)

La actualización más reciente de SAP Lumira es la 1.31, la herramienta Data Discovery de SAP. Esta herramienta es una aplicación dirigida a usuarios finales con capacidades analíticas y conocimiento del negocio, permitiéndoles cargar los datos con los que desean trabajar, depurarlos, enriquecerlos (generar nuevas columnas, indicadores y jerarquías), diseñar visualizaciones, construir historias que expliquen los hechos y si desean, compartir el conocimiento obtenido.

sap-lumira-1-31-la-ultima-actualizacion-de-la-herramienta-de-data-discovery-de-sap


La actualización más reciente de SAP Lumira es la 1.31, la herramienta Data Discovery de SAP. Esta herramienta es una aplicación dirigida a usuarios finales con capacidades analíticas y conocimiento del negocio, permitiéndoles cargar los datos con los que desean trabajar, depurarlos, enriquecerlos (generar nuevas columnas, indicadores y jerarquías), diseñar visualizaciones, construir historias que expliquen los hechos y si desean, compartir el conocimiento obtenido.

sap-lumira-1-31-la-ultima-actualizacion-de-la-herramienta-de-data-discovery-de-sap

Desde la actualización 1.23 de SAP Lumira (también llamado SAP BusinessObjects Lumira y antes conocido como SAP Visual Intelligence) se incluye un nuevo motor para tratamiento de datos, basado en técnicas en memoria, lo que posibilita trabajar con conjuntos de datos de gran tamaño, para lo cual es necesario sistemas operativos de 64 bits. Para sistemas operativos de 32 bits se puede utilizar hasta la actualización 1.25 la cual ha tenido soporte hasta el 30 de septiembre de 2016.

product-availability-matrix-pam-de-sap-lumira-1-31

SAP sugiere que para usuarios sin un sistema operativo de 64 bits, acceden vía escritorio remoto o Citrix a equipos con Sistema Operativo 64 bits con una instalación de una actualización reciente de SAP Lumira. (Referencia: Nota SAP 2152737), se debe recordar que los sistemas operativos de 64 bits ofrecen características multi-usuario.

Si deseas probar este producto, accede al siguiente enlace para descargar una edición de prueba o trial: (aquí gratis)

Conjuntos o Sets en SAP BusinessObjects BI 4.2 SP03

Quizás muy pocos han oído sobre “Set Analysis” de Business Objects 3.1, sí, de la era cuando BusinessObjects se escribía Business Objects… prehistoria del BI… La última vez que conocí un caso de uso de este componente fue en 2007 en el área de marketing para una empresa aseguradora, el objetivo que perseguían, en ese entonces, era la segmentación y clasificación de clientes. Estamos hablando de una aplicación de la plataforma de BI de Business Objects 3.1, tal como Universe Designer o Desktop Intelligence, aplicaciones contemporáneas de este producto.


Quizás muy pocos han oído sobre “Set Analysis de Business Objects 3.1, sí, de la era cuando BusinessObjects se escribía Business Objects… prehistoria del BI… La última vez que conocí un caso de uso de este componente fue en 2007 en el área de marketing para una empresa aseguradora, el objetivo que perseguían, en ese entonces, era la segmentación y clasificación de clientes. Estamos hablando de una aplicación de la plataforma de BI de Business Objects 3.1, tal como Universe Designer o Desktop Intelligence, aplicaciones contemporáneas de este producto.

Sets o Conjuntos de SAP BO BI 4.2 SP03

El último documento oficial que he encontrado sobre “Set Analysis” data del 2010. Con la llegada de la versión 4.0 de BusinessObjects esta aplicación “desapareció”. Luego de 6 años, SAP  ha recuperado “Set Analysis”  y la introducido en la actualización 4.2 SP03, liberada a mediados de agosto. Para este fin, se ha creado una nueva categoría de objetos denominado Sets cuya seguridad se podrá gestionar en la CMC. Al igual que las conexiones y universos, los sets o conjuntos serán definidos desde el Information Design Tool, la herramienta para crear universos UNX.

Conjuntos BI BO 4.2 Sp03 - Definicion

¿Qué son los Sets?

Los Sets o los conjuntos son una nueva categoría de objetos vinculados a los universos publicados en el repositorio de la plataforma BusinessObjects BI , los cuales podrán ser utilizados para elaborar consultas complejas en Web Intelligence, cuando se requiere definir filtros asociados a dimensiones cuyo valor podría estar comprendido en una lista de valores.  Los conjuntos podrán estar asociados a calendarios (temporal sets, en la aplicación anterior se denominaban Dinámicos) para observar la evolución en períodos de tiempo. Si no tuviesen calendarios se denominaran estáticos, con lo cual, se obtendrían “instantáneas” de la consulta efectuada.  

Por ejemConjuntos BI BO 4.2 Sp03plo, para obtener una relación de clientes que residan en ciertas ciudades, que tengan un rango de edad, que hayan comprado determinados productos y tuviesen hijos, con conjuntos sería tan fácil como arrastrar los conjuntos adecuados. SAP ha presentado esta funcionalidad como una herramienta para completar las tareas de las áreas de marketing y aplicaciones CRM (Customer Relationship Management).

CMC de SAP BusinessObjects BI 4.2 SP03

Particularmente observamos que los conceptos y filosofía de trabajo de los Conjuntos o Sets de la 4.2 SP03 son los mismos de Set Analysis 3.1 de hace seis años atrás. La definición al comienzo parece algo compleja, pero será cuestión de habituarse al procedimiento.

Estadística: ¿De qué “promedio” estamos hablando?

Los “estudios” sobre características o hábitos de las personas proliferan por todas partes, y en todos ellos se impone el término promedio, tratando de transmitir, como verdad absoluta e irrefutable, las conclusiones de estos “análisis”. Pero la palabra “promedio” tiene un significado muy vago, al utilizarla, deberíamos tener la certeza de qué estamos hablando: media aritmética, mediana o moda.


Los “estudios” sobre características o hábitos de las personas proliferan por todas partes, y en todos ellos se impone el término “promedio”, tratando de transmitir, como verdad absoluta e irrefutable, las conclusiones de estos “análisis”.  Pero la palabra “promedio” tiene un significado muy vago, al utilizarla, deberíamos tener la certeza de qué estamos hablando: media aritmética, mediana o moda.

Debe tener presente que cuando se quiere obtener un valor elevado se recurre a la media aritmética. Por ejemplo, si se desea informar sobre los ingresos medios de una muestra, la media aritmética se obtendrá sumando todos los ingresos de cada elemento y dividiendo esta suma por el número de elementos sumados.

En el caso de la mediana, si nos informan un valor tal como “X”, para el ejemplo de los ingresos promedio, nos estarán señalando que la mitad de la muestra tiene unos ingresos superiores a “X” y que la otra mitad dispone de unos ingresos inferiores a “X”.  La moda, es la cifra que aparece el mayor número de veces en una distribución, en comparación con cualquier otra cantidad.

Los distintos promedios suelen coincidir sólo cuando se analizan características físcas humanas, los cuales suelen estar dentro de lo que se denominan una “distribución normal”, si se representa con un gráfico de líneas, se podría obtener una “campana”, coincidiendo la media, mediana y moda casi en el mismo punto. En cambio, si se representa gráficamente un valor como los ingresos, obtendríamos una representación similar a un “tobogán”, dónde la mediana y la media estarían en puntos considerablemente alejados.

Si en el estudio que estamos leyendo no se señala en cada valor informado que tipo de promedio se ha obtenido, ese valor no tiene ninguna utilidad al poder tener tres posibles interpretaciones.

Referencia: Como mentir con estadísticas (Darrell Huff)