Archivo de la categoría: Conceptos BI

Teorías y conceptos sobre Business Intelligence

Data discovery, mejor representante del Business Analytics


Cuando hablamosbusiness-intelligence-vs-business-analytics sobre Business Analytics, es hablar de una nueva generación de herramientas más abiertas y flexibles con relación a las que ofrece el clásico Business Intelligence, es esta categoría encontramos productos que reciben calificativos tales como herramientas de exploración, herramientas de descubrimiento  de datos, herramientas de visualización, buscadores empresariales, entre otros.  Comparando el BI con el BA, podríamos destacar los siguientes aspectos:

comparativa-del-business-intelligence-y-business-analytics

Data Discovery

El Data discovery o herramienta de descubrimiento de datos, es la categoría más completa del Business Analytics al incluir posibilidades de tratar directamente las fuentes de datos, depurarlas, filtrarlas, diseñar visualizaciones y facilitar su análisis. Podríamos destacar los siguientes beneficios del Data Discovery y por consiguiente del Business Analytics:

  • Nueva información para todos los niveles de gestión, consecuencia de nuevas perspectivas que se adaptan con más inmediatez a nuevas circunstancias.
  • Disminución de los requerimientos de evolutivos o cambios al equipo responsable de T.I., dado que los analistas acceden a las fuentes de datos, identifican las que requieren, acceden a las mismas y construyen sus documentos de análisis sin la necesidad de contar con conocimientos técnicos profundos o requerir el soporte constante de un experto.

Sugerencias para los analistas

  • Negocio. Ante todo, conocer el proceso de negocio, su ciclo productivo, lo bueno, lo malo, lo mejorable y lo prescindible.
  • No focalizarse en una única hipótesis. Realizar tareas de análisis contantes sobre diversos conjuntos de datos, si no se encuentra resultados relevantes en una iteración, seguir intentando con otro conjunto de datos.
  • Cuestionar los resultados. A partir de los resultados de un análisis, formular preguntas y tratar de comprender y encontrar explicaciones, a partir de un resultado se podría iniciar una nueva tarea de análisis.

Visión del Business Analytics como evolución del Business Intelligence


Al margen de intereses comerciales ajenos, entendemos el Business Analytics como una evolución del Business Intelligence, usualmente implementado de manera rígida, sobre información y modelos de datos conocidos, dando lugar, con mucha probabilidad, que día a día, no tengas ningún sobresalto al observar el reporting , tableros y cuadros de mando que con mucho esfuerzo se ha adoptado en tu organización.

Del tubo único, a la red de tuberías, la información valiosa puede venir de cualquier parte

Pero hace tiempo que las cosas han cambiado, los datos ya no vienen por una única tubería. Hoy por hoy, la variedad y velocidad como llegan los datos, se confrontan con la necesidad de analizarlos con el fin de obtener conclusiones rápidas, veraces y útiles para gestionar los procesos del negocio. Así, en esta coyuntura, surge el concepto del Business Analytics el cual debería tender a lo siguiente:

  • Facilidad para integrar información de sistemas heterogéneos.
  • Mayor facilidad para acceder a las fuentes de datos.
  • Uso de otras técnicas de análisis, además de los clásicos reporting y cuadros de mando.
  • Independencia del área de técnica.
  • Preparación de los datos en menor tiempo.
  • Orientado al self service o autoservicio (usuarios capaces de crear sus propios documentos de análisis).
  • Mejor uso de las mayores capacidades de procesamiento de los equipos actuales.

La implementación del Business Analytics tiene dos pilares, por un lado, la adopción de herramientas o plataformas tecnológicas que faciliten un análisis más ágil y por otro lado, quizás aún más relevante que el componente técnico, es la adopción de esta filosofía en la organización, la cual facilite el acceso a otras fuentes de información y valore las conclusiones que de este nuevo análisis se obtenga.

Claves para definir buenas métricas


La asignación de recursos y esfuerzos a nuestros procesos de negocio, en cantidad, forma y momento oportuno, pasa por medir adecuadamente la salud de nuestra organización. Pero, ¿qué debemos medir? No hay una respuesta única o universal, porque la situación y aspiración de cada empresa es muy diversa.

Hemos visto muchos tips o claves para seleccionar las métricas adecuadas, nosotros sugerimos tener presente los siguientes factores al seleccionar una buena métrica:

  • Comparable. Debe ser posible compararla con otro período de tiempo, grupo de usuarios o con la competencia. Es más útil saber que “hemos incrementado la conversión con relación a la semana anterior” que “la conversión es igual al 2%”. Así mismo, debería ser comparable consigo misma (Inherentemente Comparativa), por ejemplo, un indicador diario comparado a nivel mes, podría señalar una variación repentina o un cambio en la tendencia.
  • Comprensible. Si los usuarios de los indicadores no lo recuerdan o no pueden discutir sobre el mismo, difícilmente será útil para lograr algún cambio.
  • Encaminan a la acción. Si estamos conduciendo un vehículo, la distancia recorrida es un dato informativo. Pero la velocidad (distancia por hora), es un dato que encamina a la acción, porque nos facilitará decidir si debemos ir más rápidos o más lentos para llegar al destino en el momento deseado.

Referencia: ISBN 978-1-449-33567-0

Preguntas claves para valorar la utilidad de una visualización


Las representaciones gráficas que en ocasiones utilizamos, tales como los gráficos de columnas o el de líneas, se remontan al siglo dieciocho y no es hasta mediados del siglo pasado que estos se perfeccionan a través de la formalización de técnicas que se aplican a las actuales herramientas informáticas que se utilizan para crearlos.

Playfair incluido este gráfico en su Anuncio y Atlas Político (1786) para argumentar en contra de la política de financiación de las guerras coloniales a través de la deuda nacional de Inglaterra

Es innegable la importancia de transformar los datos en representaciones gráficas o visualizaciones, la alternativa más inmediata y fácil para comunicar y comprender los grandes volúmenes de información que nos pueden llegar a rodear.  A partir de esta necesidad, han surgido una amplia gama de soluciones con posibilidades gráficas de dudosa utilidad para el análisis, pero de innegable impacto visual.

How is life - OECDURL

Una representación gráfica o visualización, que para comprenderla requiere una compleja explicación, va en contra los principios básicos de esta disciplina: claridad e inmediatez.  Para saber si un gráfico será útil, plantéese las siguientes cuestiones:

  • ¿Claramente indica la naturaleza de la relación de los valores representados?
  • ¿Representa las cantidades con exactitud?
  • ¿Facilita comparar las cantidades?
  • ¿Es más fácil ver el orden o clasificación de los valores?
  • ¿Resulta evidente cómo se debe utilizar la información?

Referencia: Interaction Design Foundation

Buenas prácticas en el diseño de gráficos (y IV): Histogramas


Un histograma es una representación gráfica que secciona un grupo de datos en función de los valores de un indicador o variable numérica (por ejemplo, edad, ingresos o gastos) y muestra el número de elementos (frecuencia) o el porcentaje (frecuencia relativa) que representa cada grupo de elementos. Los casos más usuales son para analizar atributos o características de grupos de poblaciones.

Histograma utilizando el componente Gráfico de Columnas de SAP Dashboards (Xcelsius)

Al diseñar un histograma ten presente los siguientes aspectos

  • Comprobar si las unidades del eje vertical indican frecuencias o frecuencias relativas. Si se trata de frecuencia relativa, es necesario conocer el tamaño de la muestra para hacer una adecuada interpretación.
  • Comprobar la escala utilizada en el eje horizontal (para los grupos de valores del indicador o variable numérica):
    • Si los intervalos de valores son pequeños, posiblemente la altura de las columnas sea muy variable y se dificulte su interpretación.
    • Si los intervalos son grandes la representación gráfica se podría ver más uniforme de lo que realmente es.

Buenas prácticas en el diseño de gráficos (III): Cronogramas o gráficos de líneas


Un cronograma o gráfico de líneas muestra la variación de los valores de un indicador o variable a lo largo de un período de tiempo. Cuando tengas la oportunidad de analizar o diseñar un gráfico de este tipo, ten presente lo siguiente:

  • Observa si las escalas del eje vertical (cantidad) y del eje horizontal (línea temporal) son las adecuadas, alterando la escala se puede conseguir que los valores parezcan más o menos significativos de lo que son en realidad.
  • Comprueba la distancia de separación entre los puntos del eje temporal, deberían ser uniformes. Si no hay datos para un período, de igual modo, debería visualizarse.
  • Verifica que las unidades representadas son válidas para realizar comparaciones a lo largo del tiempo. En algunas ocasiones las unidades monetarias deberían ser ajustadas considerando la inflación.
  • Las explicaciones sobre posibles tendencias que muestre este tipo de gráficos debe ser sustentada con información estadística. Un gráfico que representa la evolución de un indicador en el tiempo, muestra lo que está ocurriendo, no las causas que podrían determinar su comportamiento futuro.

Roambi Analytics for iPad - View Trends

Post relacionados: aquí y aquí

Buenas prácticas en el diseño de gráficos (II): Gráficos de barras


En esta categoría de gráficos incluimos tanto a los denominados gráficos de columnas (representaciones rectangulares verticales) como los gráficos de barras (representaciones rectangulares horizontales).  En ambos casos son similares al gráfico de sectores (ver entrada anterior), en cuanto a que los valores de los grupos de datos son representados en porciones proporcionales al número (frecuencia) o porcentaje (frecuencia relativa) del valor de cada grupo.

Detalle de la vista CataList de Roambi Analytics

Cuando diseñes o revises gráficos de barras, ten presente lo siguiente:

  • Se debe señalar las unidades representadas por el tamaño de las barras y qué significan los resultados.
  • Observar cual es el punto inicial del eje donde se encuentran las cantidades o porcentajes, lo usual y recomendable es que inicie en 0. Por ejemplo, si el punto inicial del eje es 30, todas las barras aparecerán cortadas por la parte inferior, por lo que las diferencias que hubiera entre 0 y 100, parecerán más importantes de lo que deberían
  • Prestar atención al tamaño entre cada punto, por ejemplo, si las alturas de las barras fluctúan entre 200 y 300 pero el eje comienza en 0, las diferencias parecerán poco relevantes.
  • Comprueba el rango de valores en el eje donde se señalan las cantidades o porcentajes:
    • Verifica si el gráfico tiene más espacio de lo que requieren los valores representados (demasiado espacio libre o en blanco), las diferencias entre las barras serían difíciles de apreciar.
    • Por el contrario, si hay apenas espacio en blanco, las barras aparecerán más estiradas de lo que deberían, las diferencias entre ellas se percibirán mayor de lo que realmente son.

CardexView de Roambi Analytics

El Business Intelligence y Business Analytics, según #Gartner


Comenzando a leer el resumen del informe “Magic Quadrant for Business Intelligence and Analytics Platforms 2013” de Gartner:

Según la visión de Gartner, el Business Intelligence (BI) y Business Analytics (BA) deberían conformar una plataforma única, la cual debería ofrecer hasta 15 principales funcionalidades, agrupadas en tres grandes categorías:

Funcionalidades por categorias de una plataforma de Business Intelligence y Business Analytics, vista como una única unidad

Integración

  • Infraestructura BI. Debe ser única y común para gestionar todos los recursos y funcionalidades de la plataforma.
  • Gestión de metadatos. Deben ser reaprovechables y base para definir nuevos objetos. La plataforma de brindar las herramientas para gestionarlos.
  • Herramientas de desarrollo.  Debe brindar los recursos necesarios para diseñar aplicaciones analíticas que puedan ser integradas a los procesos de negocio u otras aplicaciones.
  • Colaboración. Debe facilitar el intercambio de idea o diálogos entre usuarios que analizan la información a través del uso de anotaciones, chats o foros.

Distribución de la información (Information Delivery)

  • Informes (Reporting). Facilidades para crear informes con formato e interactivos, con o sin parámetros y posibilidades de programar su distribución
  • Tableros de datos (Dashboards). Informes para Web o dispositivos móviles con pantallas táctiles que indiquen el estado de una métrica de rendimiento en comparación con un objetivo o valor objetivo.
  • Consultas personalizadas (Ad hoc query). Permitir a los usuarios elaborar sus propias consultas, para lo que resulta muy necesario contar con una capa semántica.
  • Integración con Microsoft Office.  Especialmente con MS Excel, ofreciendo las posibilidades de análisis integradas con todas las características que ofrece este programa de hojas de cálculo.
  • Búsquedas (Search-based BI). La interfaz de usuario deberá ofrecer funcionalidades de búsqueda de datos estructurados y no estructurados.
  • Movilidad (Mobile BI). Facilitar la distribución de contenidos BI o analíticos a través de los dispositivos móviles ya ea a través de publicaciones y/o modo interactivo.

Análisis (Analysis)

  • Procesamiento analítico en línea (Online analytical processing – OLAP). Permite a los usuarios acceder a los datos a través de consultas ad hoc con cálculos y resultados rápidos, posibilitando los análisis desde diferentes niveles de agregación de la información utilizando técnicas como  “slicing and dicing” o “drilldown / drillup”.  Del mismo modo, esta característica debería facilitar la construcción de escenarios “What if”. La posibilidad de esta característica podría implicar arquitecturas da datos multidimensionales, relacionales o inclusive técnicas de procesamiento en memoria.
  • Visualización interactiva (Interactive visualization). Posibilidad de mostrar los importes a través de imágenes y gráficos, en vez de tablas de filas y columnas.
  • Minería de datos y modelado predictivo (Predictive modeling and data mining). Aplicación de algoritmos matemáticos y técnicas estadísticas para facilitar la identificación de características en un conjunto de datos a través del tratamiento de variables (Variable = atributo o propiedad que admite diversos datos. Las Variables Categóricas clasifican a los sujetos facilitando su agrupación. Las Variables Continuas toman un número infinito de valores).
  • Cuadros de mando (Scorecards). Alineación de los indicadores claves de rendimiento (KPIs) con los objetivos estratégicos de los negocios a través del diseño de paneles.
  • Modelado Prescriptivo, simulación y optimización  (Prescriptive modeling, simulation and optimization).  El análisis prescriptivo es el siguiente paso o un complemento del análisis predictivo, el cual, a partir de un modelo predictivo sugiere la decisión o decisiones que podrían tomarse.

Manipulación de ejes de los gráficos


La finalidad de un gráfico es transmitir de la manera más inmediata una lectura e interpretación de un conjunto de datos.  Pero si el gráfico es manipulado, con o sin intención, el usuario que lo visualiza podría quedarse con una percepción errónea de lo que esta tratando de analizar.

La manipulación de un gráfico puede producirse por varías vías, pero lo más usual es cuando se utiliza una escala de los ejes no acorde con los datos a representar o cuando se le da al gráfico unas dimensiones desproporcionadas horizontal y verticalmente.

Por ejemplo, si tenemos los siguientes datos:

Manipulación de ejes - Valores a gráficar (01)

Utilizando Xcelsius (SAP BusinessObjects Dashboards) realizamos un gráfico de líneas, obtendríamos el siguiente resultado:

Manipulación de ejes - Grafico de líneas con el eje Y con la escala por defecto (02)

Ajustando la escala del eje Y coherentemete con los datos representados:

Manipulación de ejes - Parámetros para ajustar la escala del eje Y (04)

Obtendríamos la siguiente imagen:

Manipulación de ejes - Eje Y ajustado correctamente (03)

Disminución de la tendencia

Si alteramos la escala del eje Y, conseguimos atenuar la tendencia de los datos:

Manipulación de ejes - Disminución de la tendencia, incrementando excesivamente la escala del eje Y (05)

Del mismo modo, si aumentamos desproporcionalmente, sólo el tamaño horizontal del gráfico, visualmente disminuimos el impacto de la tendencia:

Manipulación de ejes - Disminución de la tendencia, aumentando horizontalmente el tamaño del gráfico (06)

Si combinamos las dos “técnicas” anteriores, la disminución de la tendencia es aun más notorio:

Manipulación de ejes - Disminución de la tendencia, aplicando las técnicas anteriores (07)

Aumento de la tendencia

Si agregamos más valores a la escala del eje X, obtenemos una mayor pronunciación de la tendencia:

Manipulación de ejes - Acentuar la tendencia, incrementando la escala del Eje X (08)

Si aumentamos sólo el tamaño vertical del gráfico, conseguimos una impresión visual de una tendencia muy pronunciada.

Manipulación de ejes - Acentuar la tendencia, aumentando verticalmente el tamaño del gráfico (09)

Combinando las dos “técnicas” anteriores tenemos un gráfico con una tendencia exageradamente pronunciada.

Manipulación de ejes - Acentuar la tendencia, aplicando las dos técnicas anteriores (10)

Uso incorrecto de las escalas en los gráficos


Cuando utilizamos una herramienta para el diseño de visualizaciones gráficas como SAP BusinessObjects Dahsboard (Xcelsius) dejamos de utilizar muchas propiedades, asumiendo sus valores por defecto.  Pero resulta que muchas veces estos valores que tiene la herramienta no son los que se requieren según lo que se esté representando.  Una de estas propiedades, es la Escala.

Por ejemplo, se desea comparar la variación salarial entre dos poblados con los siguientes valores:

Valores a comparar mediante una representacion grafica

Si se representan estas dos series de valores y optamos por asumir el valor por defecto de la propiedad Escala, tendremos un eje vertical (Y) con una escala lineal o aritmética.

Con en este grafico se puede llegar a interpretar que los salarios de la Poblacion B tienen un mayor incremento

Si vemos el gráfico anterior, la conclusión inmediata sería que en el Poblado B hay mayores incrementos, lo que resulta inexacto.  Por otro lado, si indicamos la escala logarítmica tendríamos lo siguiente.

Con una escala logaritmica se obtiene una representacion grafica mas fiel a la realidad al comparar incrementos

Este gráfico es una representación más próxima a la realidad. Lo que permite concluir que para comparar las variaciones incrementales entre series de valores, la escala correcta del eje Y debe ser logarítmica. Debemos tener en cuenta que el gráfico debe brindar de manera inmediata y fidedigna los valores que está representando.

Ajuste de parametros desde Xcelsius

Referencia: ISBN 978-84-9281-207-3