Archivo de la categoría: Best practices gráficos

Un dato, dos historias. Otro ejemplo de mal uso de las escalas en los gráficos


En entradas pasadas hemos señalado cómo, con o sin intención, podemos diseñar visualizaciones que transmiten de manera inexacta la información (aquí o aquí).  El poder del “primer impacto” que tienen los gráficos debería ser utilizado para conducir a la creación de conclusiones correctas.  La siguiente estadística corresponde a las veces en que sale un número en una lotería que premia el acierto de tres dígitos.

Ejemplo, Numero de extracciones de un número en un sorteo

La diferencia en la frecuencia entre cada número, no da lugar a considerar la existencia de un “número mágico”, pero viendo la siguiente gráfica daría esta falsa impresión:

Imagen gráifca con un mensaje inexacto sobre la realidad

El principal motivo de este mensaje incorrecto es iniciar la escala (eje Y) con un valor distinto de cero. Por otro lado, según sea el caso, se debe seleccionar el indicador más adecuada para motivar la comparación, para este ejemplo, quizás lo más acertado sería comparar a través el porcentaje de veces en que sale un número.

Representaciones gráficas más fieles a la realidad

Los visualizaciones tienen mayor impacto que cualquier otro medio para transmitir la información, antes de dar por válidos cualquier visualización debemos observar este tipo de detalles.

Referencia: ISBN 978-84-329-0157-7

Una nueva definición para la Visualización


En el documentode referencia encontramos una definición sobre Visualización de datos, la técnica cada vez más demanda en el Business Intelligence o Business Analaytics, la cual señala lo siguiente:

La Visualización de Datos es la representación y presentación de los datos que explotan nuestra percepción visual con el fin de incrementar el conocimiento.

Proceso general de la comunicación

Descomponiendo los elementos de esta definición:

  • Representación. Connota la elección de las formas físicas idóneas para mostrar determinados datos (imágenes, líneas, barras, círculos, etc).
  • Presentación. Se refiere a la integración de la representación de datos con todo el trabajo de comunicación que se esté diseñando, incluye la elección de colores, anotaciones y características interactivas.
  • Percepción visual. Implica comprender como nuestros ojos y cerebro procesan la información y reconocen con inmediatez los patrones que conllevan las representaciones gráficas.
  • Incrementar el conocimiento. Se trata de maximizar con eficiencia y eficacia nuestra habilidad de procesar la información en los pensamientos, ideas y conocimientos. El objetivo de la visualización debería ser que el lector o usuarios sientas que han llegado a ser mejor informados sobre un tema.

Referencia: ISBN 978-1-84969-346-2

Visualización vs. Infografía


Visualizaciones o Data Visializations (Data viz) a menudo se relaciona con infografías cuando tienen realmente muy poco en común. En primer lugar, difieren en el método de generación, la visualizaciones se apoyan en datos asociados a métricas para transmitir una información en particular, mientras las infografías de valen más de imágenes para transmitir conclusiones.

Infografia 01(original)

El grado de tratamiento de imágenes en una infografía puede tener un elevado nivel de diseño, muy superior a lo que podemos encontrar en una visualización.

Infografia 02(original)

La interactividad es importante en una visualización, la cual deberá derivar en una actualización o refresco de los datos que se esté mostrando.  La interactividad en una infografía es inexistente, los datos suelen permanecer cual si fuera una fotografía o instantánea.

Muestra de visualización(original)

Referencia: ISBN 978-1-118-50289-1

Preguntas claves para valorar la utilidad de una visualización


Las representaciones gráficas que en ocasiones utilizamos, tales como los gráficos de columnas o el de líneas, se remontan al siglo dieciocho y no es hasta mediados del siglo pasado que estos se perfeccionan a través de la formalización de técnicas que se aplican a las actuales herramientas informáticas que se utilizan para crearlos.

Playfair incluido este gráfico en su Anuncio y Atlas Político (1786) para argumentar en contra de la política de financiación de las guerras coloniales a través de la deuda nacional de Inglaterra

Es innegable la importancia de transformar los datos en representaciones gráficas o visualizaciones, la alternativa más inmediata y fácil para comunicar y comprender los grandes volúmenes de información que nos pueden llegar a rodear.  A partir de esta necesidad, han surgido una amplia gama de soluciones con posibilidades gráficas de dudosa utilidad para el análisis, pero de innegable impacto visual.

How is life - OECDURL

Una representación gráfica o visualización, que para comprenderla requiere una compleja explicación, va en contra los principios básicos de esta disciplina: claridad e inmediatez.  Para saber si un gráfico será útil, plantéese las siguientes cuestiones:

  • ¿Claramente indica la naturaleza de la relación de los valores representados?
  • ¿Representa las cantidades con exactitud?
  • ¿Facilita comparar las cantidades?
  • ¿Es más fácil ver el orden o clasificación de los valores?
  • ¿Resulta evidente cómo se debe utilizar la información?

Referencia: Interaction Design Foundation

Buenas prácticas en el diseño de gráficos (y IV): Histogramas


Un histograma es una representación gráfica que secciona un grupo de datos en función de los valores de un indicador o variable numérica (por ejemplo, edad, ingresos o gastos) y muestra el número de elementos (frecuencia) o el porcentaje (frecuencia relativa) que representa cada grupo de elementos. Los casos más usuales son para analizar atributos o características de grupos de poblaciones.

Histograma utilizando el componente Gráfico de Columnas de SAP Dashboards (Xcelsius)

Al diseñar un histograma ten presente los siguientes aspectos

  • Comprobar si las unidades del eje vertical indican frecuencias o frecuencias relativas. Si se trata de frecuencia relativa, es necesario conocer el tamaño de la muestra para hacer una adecuada interpretación.
  • Comprobar la escala utilizada en el eje horizontal (para los grupos de valores del indicador o variable numérica):
    • Si los intervalos de valores son pequeños, posiblemente la altura de las columnas sea muy variable y se dificulte su interpretación.
    • Si los intervalos son grandes la representación gráfica se podría ver más uniforme de lo que realmente es.

Buenas prácticas en el diseño de gráficos (III): Cronogramas o gráficos de líneas


Un cronograma o gráfico de líneas muestra la variación de los valores de un indicador o variable a lo largo de un período de tiempo. Cuando tengas la oportunidad de analizar o diseñar un gráfico de este tipo, ten presente lo siguiente:

  • Observa si las escalas del eje vertical (cantidad) y del eje horizontal (línea temporal) son las adecuadas, alterando la escala se puede conseguir que los valores parezcan más o menos significativos de lo que son en realidad.
  • Comprueba la distancia de separación entre los puntos del eje temporal, deberían ser uniformes. Si no hay datos para un período, de igual modo, debería visualizarse.
  • Verifica que las unidades representadas son válidas para realizar comparaciones a lo largo del tiempo. En algunas ocasiones las unidades monetarias deberían ser ajustadas considerando la inflación.
  • Las explicaciones sobre posibles tendencias que muestre este tipo de gráficos debe ser sustentada con información estadística. Un gráfico que representa la evolución de un indicador en el tiempo, muestra lo que está ocurriendo, no las causas que podrían determinar su comportamiento futuro.

Roambi Analytics for iPad - View Trends

Post relacionados: aquí y aquí

Buenas prácticas en el diseño de gráficos (II): Gráficos de barras


En esta categoría de gráficos incluimos tanto a los denominados gráficos de columnas (representaciones rectangulares verticales) como los gráficos de barras (representaciones rectangulares horizontales).  En ambos casos son similares al gráfico de sectores (ver entrada anterior), en cuanto a que los valores de los grupos de datos son representados en porciones proporcionales al número (frecuencia) o porcentaje (frecuencia relativa) del valor de cada grupo.

Detalle de la vista CataList de Roambi Analytics

Cuando diseñes o revises gráficos de barras, ten presente lo siguiente:

  • Se debe señalar las unidades representadas por el tamaño de las barras y qué significan los resultados.
  • Observar cual es el punto inicial del eje donde se encuentran las cantidades o porcentajes, lo usual y recomendable es que inicie en 0. Por ejemplo, si el punto inicial del eje es 30, todas las barras aparecerán cortadas por la parte inferior, por lo que las diferencias que hubiera entre 0 y 100, parecerán más importantes de lo que deberían
  • Prestar atención al tamaño entre cada punto, por ejemplo, si las alturas de las barras fluctúan entre 200 y 300 pero el eje comienza en 0, las diferencias parecerán poco relevantes.
  • Comprueba el rango de valores en el eje donde se señalan las cantidades o porcentajes:
    • Verifica si el gráfico tiene más espacio de lo que requieren los valores representados (demasiado espacio libre o en blanco), las diferencias entre las barras serían difíciles de apreciar.
    • Por el contrario, si hay apenas espacio en blanco, las barras aparecerán más estiradas de lo que deberían, las diferencias entre ellas se percibirán mayor de lo que realmente son.

CardexView de Roambi Analytics

Buenas prácticas en el diseño de gráficos (I): Gráficos de sectores


Los gráficos son una potente herramienta de análisis de la información, pero en su diseño encontramos muchos vicios, en la mayoría de los casos de manera no intencionada, más por las prisas, falta de experiencia o desconocimiento.  En las siguientes entradas compartiremos algunos tips que podríamos tener presente en el diseño de visualizaciones.

PieView de Roambi Analytics, excelente herramienta para el diseño de visualizaciones en dispositivos móviles

Gráficos de Sectores

Nos referimos en especial a los gráficos circulares que representan los datos en forma de pastel o tarta, divididos en porciones (sectores) que corresponden al porcentaje (frecuencia relativa) de elementos pertenecientes a distintos grupos.  Los grupos de datos representan una variable categórica, como puede ser sexo, situación laboral o ubicación geográfica. Para este tipo de gráficos ten presente lo siguiente:

  • La suma de los porcentajes siempre debe ser 100% (Si fuera diferente, se podría aceptar si la diferencia es mínima y se debe a un error de redondeo).
  • Evita o no aceptes una porción con la denominación “Otros” (o cualquier denominación similar) cuyo tamaño sea mayor al de cualquier otro sector con una denominación concreta. Debería informarse su contenido o dividir este sector.
  • Un gráfico con demasiados sectores no aporta información valiosa que motiven conclusiones inmediatas. Desvirtúa el objetivo que debe brindar todo gráfico: lectura inmediata de la información relevante.
  • Los gráficos tridimensionales pueden distorsionar la información que representa cada porción, las porciones de primer plano pueden parecer más grandes de lo que realmente deberían ser.

Manipulación de ejes de los gráficos


La finalidad de un gráfico es transmitir de la manera más inmediata una lectura e interpretación de un conjunto de datos.  Pero si el gráfico es manipulado, con o sin intención, el usuario que lo visualiza podría quedarse con una percepción errónea de lo que esta tratando de analizar.

La manipulación de un gráfico puede producirse por varías vías, pero lo más usual es cuando se utiliza una escala de los ejes no acorde con los datos a representar o cuando se le da al gráfico unas dimensiones desproporcionadas horizontal y verticalmente.

Por ejemplo, si tenemos los siguientes datos:

Manipulación de ejes - Valores a gráficar (01)

Utilizando Xcelsius (SAP BusinessObjects Dashboards) realizamos un gráfico de líneas, obtendríamos el siguiente resultado:

Manipulación de ejes - Grafico de líneas con el eje Y con la escala por defecto (02)

Ajustando la escala del eje Y coherentemete con los datos representados:

Manipulación de ejes - Parámetros para ajustar la escala del eje Y (04)

Obtendríamos la siguiente imagen:

Manipulación de ejes - Eje Y ajustado correctamente (03)

Disminución de la tendencia

Si alteramos la escala del eje Y, conseguimos atenuar la tendencia de los datos:

Manipulación de ejes - Disminución de la tendencia, incrementando excesivamente la escala del eje Y (05)

Del mismo modo, si aumentamos desproporcionalmente, sólo el tamaño horizontal del gráfico, visualmente disminuimos el impacto de la tendencia:

Manipulación de ejes - Disminución de la tendencia, aumentando horizontalmente el tamaño del gráfico (06)

Si combinamos las dos “técnicas” anteriores, la disminución de la tendencia es aun más notorio:

Manipulación de ejes - Disminución de la tendencia, aplicando las técnicas anteriores (07)

Aumento de la tendencia

Si agregamos más valores a la escala del eje X, obtenemos una mayor pronunciación de la tendencia:

Manipulación de ejes - Acentuar la tendencia, incrementando la escala del Eje X (08)

Si aumentamos sólo el tamaño vertical del gráfico, conseguimos una impresión visual de una tendencia muy pronunciada.

Manipulación de ejes - Acentuar la tendencia, aumentando verticalmente el tamaño del gráfico (09)

Combinando las dos “técnicas” anteriores tenemos un gráfico con una tendencia exageradamente pronunciada.

Manipulación de ejes - Acentuar la tendencia, aplicando las dos técnicas anteriores (10)

Uso incorrecto de las escalas en los gráficos


Cuando utilizamos una herramienta para el diseño de visualizaciones gráficas como SAP BusinessObjects Dahsboard (Xcelsius) dejamos de utilizar muchas propiedades, asumiendo sus valores por defecto.  Pero resulta que muchas veces estos valores que tiene la herramienta no son los que se requieren según lo que se esté representando.  Una de estas propiedades, es la Escala.

Por ejemplo, se desea comparar la variación salarial entre dos poblados con los siguientes valores:

Valores a comparar mediante una representacion grafica

Si se representan estas dos series de valores y optamos por asumir el valor por defecto de la propiedad Escala, tendremos un eje vertical (Y) con una escala lineal o aritmética.

Con en este grafico se puede llegar a interpretar que los salarios de la Poblacion B tienen un mayor incremento

Si vemos el gráfico anterior, la conclusión inmediata sería que en el Poblado B hay mayores incrementos, lo que resulta inexacto.  Por otro lado, si indicamos la escala logarítmica tendríamos lo siguiente.

Con una escala logaritmica se obtiene una representacion grafica mas fiel a la realidad al comparar incrementos

Este gráfico es una representación más próxima a la realidad. Lo que permite concluir que para comparar las variaciones incrementales entre series de valores, la escala correcta del eje Y debe ser logarítmica. Debemos tener en cuenta que el gráfico debe brindar de manera inmediata y fidedigna los valores que está representando.

Ajuste de parametros desde Xcelsius

Referencia: ISBN 978-84-9281-207-3