Buenas prácticas en el diseño de gráficos (y IV): Histogramas

Un histograma es una representación gráfica que secciona un grupo de datos en función de los valores de un indicador o variable numérica (por ejemplo, edad, ingresos o gastos) y muestra el número de elementos (frecuencia) o el porcentaje (frecuencia relativa) que representa cada grupo de elementos. Los casos más usuales son para analizar atributos o características de grupos de poblaciones.


Un histograma es una representación gráfica que secciona un grupo de datos en función de los valores de un indicador o variable numérica (por ejemplo, edad, ingresos o gastos) y muestra el número de elementos (frecuencia) o el porcentaje (frecuencia relativa) que representa cada grupo de elementos. Los casos más usuales son para analizar atributos o características de grupos de poblaciones.

Histograma utilizando el componente Gráfico de Columnas de SAP Dashboards (Xcelsius)

Al diseñar un histograma ten presente los siguientes aspectos

  • Comprobar si las unidades del eje vertical indican frecuencias o frecuencias relativas. Si se trata de frecuencia relativa, es necesario conocer el tamaño de la muestra para hacer una adecuada interpretación.
  • Comprobar la escala utilizada en el eje horizontal (para los grupos de valores del indicador o variable numérica):
    • Si los intervalos de valores son pequeños, posiblemente la altura de las columnas sea muy variable y se dificulte su interpretación.
    • Si los intervalos son grandes la representación gráfica se podría ver más uniforme de lo que realmente es.

Buenas prácticas en el diseño de gráficos (III): Cronogramas o gráficos de líneas


Un cronograma o gráfico de líneas muestra la variación de los valores de un indicador o variable a lo largo de un período de tiempo. Cuando tengas la oportunidad de analizar o diseñar un gráfico de este tipo, ten presente lo siguiente:

  • Observa si las escalas del eje vertical (cantidad) y del eje horizontal (línea temporal) son las adecuadas, alterando la escala se puede conseguir que los valores parezcan más o menos significativos de lo que son en realidad.
  • Comprueba la distancia de separación entre los puntos del eje temporal, deberían ser uniformes. Si no hay datos para un período, de igual modo, debería visualizarse.
  • Verifica que las unidades representadas son válidas para realizar comparaciones a lo largo del tiempo. En algunas ocasiones las unidades monetarias deberían ser ajustadas considerando la inflación.
  • Las explicaciones sobre posibles tendencias que muestre este tipo de gráficos debe ser sustentada con información estadística. Un gráfico que representa la evolución de un indicador en el tiempo, muestra lo que está ocurriendo, no las causas que podrían determinar su comportamiento futuro.

Roambi Analytics for iPad - View Trends

Post relacionados: aquí y aquí

Buenas prácticas en el diseño de gráficos (II): Gráficos de barras

En esta categoría de gráficos incluimos tanto a los denominados gráficos de columnas (representaciones rectangulares verticales) como los gráficos de barras (representaciones rectangulares horizontales). En ambos casos son similares al gráfico de sectores…


En esta categoría de gráficos incluimos tanto a los denominados gráficos de columnas (representaciones rectangulares verticales) como los gráficos de barras (representaciones rectangulares horizontales).  En ambos casos son similares al gráfico de sectores (ver entrada anterior), en cuanto a que los valores de los grupos de datos son representados en porciones proporcionales al número (frecuencia) o porcentaje (frecuencia relativa) del valor de cada grupo.

Detalle de la vista CataList de Roambi Analytics

Cuando diseñes o revises gráficos de barras, ten presente lo siguiente:

  • Se debe señalar las unidades representadas por el tamaño de las barras y qué significan los resultados.
  • Observar cual es el punto inicial del eje donde se encuentran las cantidades o porcentajes, lo usual y recomendable es que inicie en 0. Por ejemplo, si el punto inicial del eje es 30, todas las barras aparecerán cortadas por la parte inferior, por lo que las diferencias que hubiera entre 0 y 100, parecerán más importantes de lo que deberían
  • Prestar atención al tamaño entre cada punto, por ejemplo, si las alturas de las barras fluctúan entre 200 y 300 pero el eje comienza en 0, las diferencias parecerán poco relevantes.
  • Comprueba el rango de valores en el eje donde se señalan las cantidades o porcentajes:
    • Verifica si el gráfico tiene más espacio de lo que requieren los valores representados (demasiado espacio libre o en blanco), las diferencias entre las barras serían difíciles de apreciar.
    • Por el contrario, si hay apenas espacio en blanco, las barras aparecerán más estiradas de lo que deberían, las diferencias entre ellas se percibirán mayor de lo que realmente son.

CardexView de Roambi Analytics

El Business Intelligence y Business Analytics, según #Gartner

Comenzando a leer el resumen del informe “Magic Quadrant for Business Intelligence and Analytics Platforms 2013” de Gartner:

Según la visión de Gartner, el Business Intelligence (BI) y Business Analytics (BA) deberían conformar una plataforma única, la cual debería ofrecer hasta 15 principales funcionalidades, agrupadas en tres grandes categorías:


Comenzando a leer el resumen del informe “Magic Quadrant for Business Intelligence and Analytics Platforms 2013” de Gartner:

Según la visión de Gartner, el Business Intelligence (BI) y Business Analytics (BA) deberían conformar una plataforma única, la cual debería ofrecer hasta 15 principales funcionalidades, agrupadas en tres grandes categorías:

Funcionalidades por categorias de una plataforma de Business Intelligence y Business Analytics, vista como una única unidad

Integración

  • Infraestructura BI. Debe ser única y común para gestionar todos los recursos y funcionalidades de la plataforma.
  • Gestión de metadatos. Deben ser reaprovechables y base para definir nuevos objetos. La plataforma de brindar las herramientas para gestionarlos.
  • Herramientas de desarrollo.  Debe brindar los recursos necesarios para diseñar aplicaciones analíticas que puedan ser integradas a los procesos de negocio u otras aplicaciones.
  • Colaboración. Debe facilitar el intercambio de idea o diálogos entre usuarios que analizan la información a través del uso de anotaciones, chats o foros.

Distribución de la información (Information Delivery)

  • Informes (Reporting). Facilidades para crear informes con formato e interactivos, con o sin parámetros y posibilidades de programar su distribución
  • Tableros de datos (Dashboards). Informes para Web o dispositivos móviles con pantallas táctiles que indiquen el estado de una métrica de rendimiento en comparación con un objetivo o valor objetivo.
  • Consultas personalizadas (Ad hoc query). Permitir a los usuarios elaborar sus propias consultas, para lo que resulta muy necesario contar con una capa semántica.
  • Integración con Microsoft Office.  Especialmente con MS Excel, ofreciendo las posibilidades de análisis integradas con todas las características que ofrece este programa de hojas de cálculo.
  • Búsquedas (Search-based BI). La interfaz de usuario deberá ofrecer funcionalidades de búsqueda de datos estructurados y no estructurados.
  • Movilidad (Mobile BI). Facilitar la distribución de contenidos BI o analíticos a través de los dispositivos móviles ya ea a través de publicaciones y/o modo interactivo.

Análisis (Analysis)

  • Procesamiento analítico en línea (Online analytical processing – OLAP). Permite a los usuarios acceder a los datos a través de consultas ad hoc con cálculos y resultados rápidos, posibilitando los análisis desde diferentes niveles de agregación de la información utilizando técnicas como  “slicing and dicing” o “drilldown / drillup”.  Del mismo modo, esta característica debería facilitar la construcción de escenarios “What if”. La posibilidad de esta característica podría implicar arquitecturas da datos multidimensionales, relacionales o inclusive técnicas de procesamiento en memoria.
  • Visualización interactiva (Interactive visualization). Posibilidad de mostrar los importes a través de imágenes y gráficos, en vez de tablas de filas y columnas.
  • Minería de datos y modelado predictivo (Predictive modeling and data mining). Aplicación de algoritmos matemáticos y técnicas estadísticas para facilitar la identificación de características en un conjunto de datos a través del tratamiento de variables (Variable = atributo o propiedad que admite diversos datos. Las Variables Categóricas clasifican a los sujetos facilitando su agrupación. Las Variables Continuas toman un número infinito de valores).
  • Cuadros de mando (Scorecards). Alineación de los indicadores claves de rendimiento (KPIs) con los objetivos estratégicos de los negocios a través del diseño de paneles.
  • Modelado Prescriptivo, simulación y optimización  (Prescriptive modeling, simulation and optimization).  El análisis prescriptivo es el siguiente paso o un complemento del análisis predictivo, el cual, a partir de un modelo predictivo sugiere la decisión o decisiones que podrían tomarse.

Manipulación de ejes de los gráficos


La finalidad de un gráfico es transmitir de la manera más inmediata una lectura e interpretación de un conjunto de datos.  Pero si el gráfico es manipulado, con o sin intención, el usuario que lo visualiza podría quedarse con una percepción errónea de lo que esta tratando de analizar.

La manipulación de un gráfico puede producirse por varías vías, pero lo más usual es cuando se utiliza una escala de los ejes no acorde con los datos a representar o cuando se le da al gráfico unas dimensiones desproporcionadas horizontal y verticalmente.

Por ejemplo, si tenemos los siguientes datos:

Manipulación de ejes - Valores a gráficar (01)

Utilizando Xcelsius (SAP BusinessObjects Dashboards) realizamos un gráfico de líneas, obtendríamos el siguiente resultado:

Manipulación de ejes - Grafico de líneas con el eje Y con la escala por defecto (02)

Ajustando la escala del eje Y coherentemete con los datos representados:

Manipulación de ejes - Parámetros para ajustar la escala del eje Y (04)

Obtendríamos la siguiente imagen:

Manipulación de ejes - Eje Y ajustado correctamente (03)

Disminución de la tendencia

Si alteramos la escala del eje Y, conseguimos atenuar la tendencia de los datos:

Manipulación de ejes - Disminución de la tendencia, incrementando excesivamente la escala del eje Y (05)

Del mismo modo, si aumentamos desproporcionalmente, sólo el tamaño horizontal del gráfico, visualmente disminuimos el impacto de la tendencia:

Manipulación de ejes - Disminución de la tendencia, aumentando horizontalmente el tamaño del gráfico (06)

Si combinamos las dos “técnicas” anteriores, la disminución de la tendencia es aun más notorio:

Manipulación de ejes - Disminución de la tendencia, aplicando las técnicas anteriores (07)

Aumento de la tendencia

Si agregamos más valores a la escala del eje X, obtenemos una mayor pronunciación de la tendencia:

Manipulación de ejes - Acentuar la tendencia, incrementando la escala del Eje X (08)

Si aumentamos sólo el tamaño vertical del gráfico, conseguimos una impresión visual de una tendencia muy pronunciada.

Manipulación de ejes - Acentuar la tendencia, aumentando verticalmente el tamaño del gráfico (09)

Combinando las dos “técnicas” anteriores tenemos un gráfico con una tendencia exageradamente pronunciada.

Manipulación de ejes - Acentuar la tendencia, aplicando las dos técnicas anteriores (10)