Estadística: ¿De qué «promedio» estamos hablando?

Los “estudios” sobre características o hábitos de las personas proliferan por todas partes, y en todos ellos se impone el término promedio, tratando de transmitir, como verdad absoluta e irrefutable, las conclusiones de estos “análisis”. Pero la palabra “promedio” tiene un significado muy vago, al utilizarla, deberíamos tener la certeza de qué estamos hablando: media aritmética, mediana o moda.


Los «estudios» sobre características o hábitos de las personas proliferan por todas partes, y en todos ellos se impone el término «promedio», tratando de transmitir, como verdad absoluta e irrefutable, las conclusiones de estos “análisis”.  Pero la palabra «promedio» tiene un significado muy vago, al utilizarla, deberíamos tener la certeza de qué estamos hablando: media aritmética, mediana o moda.

Debe tener presente que cuando se quiere obtener un valor elevado se recurre a la media aritmética. Por ejemplo, si se desea informar sobre los ingresos medios de una muestra, la media aritmética se obtendrá sumando todos los ingresos de cada elemento y dividiendo esta suma por el número de elementos sumados.

En el caso de la mediana, si nos informan un valor tal como «X», para el ejemplo de los ingresos promedio, nos estarán señalando que la mitad de la muestra tiene unos ingresos superiores a «X» y que la otra mitad dispone de unos ingresos inferiores a «X».  La moda, es la cifra que aparece el mayor número de veces en una distribución, en comparación con cualquier otra cantidad.

Los distintos promedios suelen coincidir sólo cuando se analizan características físcas humanas, los cuales suelen estar dentro de lo que se denominan una «distribución normal», si se representa con un gráfico de líneas, se podría obtener una «campana», coincidiendo la media, mediana y moda casi en el mismo punto. En cambio, si se representa gráficamente un valor como los ingresos, obtendríamos una representación similar a un «tobogán», dónde la mediana y la media estarían en puntos considerablemente alejados.

Si en el estudio que estamos leyendo no se señala en cada valor informado que tipo de promedio se ha obtenido, ese valor no tiene ninguna utilidad al poder tener tres posibles interpretaciones.

Referencia: Como mentir con estadísticas (Darrell Huff)

Estadística: Factores a tener en cuenta al buscar una muestra

La muestra escogida al azar es la mejor fuente que puede examinarse con completa confianza por medio de la teoría estadística, pero lamentablemente es difícil y costosa de obtener. Un sustituto más económico, es la denominada muestra al azar por estratos para encuestas de opinión, el cual consiste en dividir la población por partes, tomándose grupos proporcionales a los mismos.


La muestra escogida al azar es la mejor fuente que puede examinarse con completa confianza por medio de la teoría estadística, pero lamentablemente es difícil y costosa de obtener. Un sustituto más económico, es la denominada muestra al azar por estratos para encuestas de opinión, el cual consiste en dividir la población por partes, tomándose grupos proporcionales a los mismos.

Pero sin embargo, las encuestas, muchas veces recurridas para obtener una muestra, se pueden ver influenciadas por todos los elementos que la componen, por este motivo, se debe tener en consideración lo siguiente:

  • Las muestras de la población escogidas distan mucho de ser tomadas al azar y podrían ser no del todo representativas.
  • Cualquier cuestionario no es sino una muestra de las posibles preguntas que podrían formularse.
  • Las respuestas obtenidas no es sino una muestra de la actitud y experiencia de cada encuestado sobre cada una de las cuestiones consultadas.
  • Los componentes del equipo de investigadores, con su actitud, inconscientemente, podrían influir en los resultados.

Para comprobar la calidad de una muestra tomada al azar, formule la siguiente pregunta: ¿tiene cada nombre o cosa del grupo total la misma posibilidad de formar parte de esta muestra? Y por otro lado, analice si las preguntas a formular son las idóneas en el contexto en que se formulen.

Referencia: Como mentir con estadísticas (Darrell Huff)

Los LOBs Hibridos de SAP HANA Database

Como veíamos en la entrada anterior, con los tipos de datos LOB de SAP HANA es posible almacenar datos de gran tamaño, tales como documentos, imágenes o videos. Ahora bien, pero toda esta información dentro de una estructura de tablas de la base de datos podría significar un gran consumo de recursos de manera innecesaria. Desde la actualización SPS 07 de SAP HANA están disponibles los denominados LOBs híbridos, los cuales estarán en memoria sólo cuando son utilizados.


Como veíamos en la entrada anterior, con los tipos de datos LOB de SAP HANA es posible almacenar datos de gran tamaño, tales como documentos, imágenes o videos. Ahora bien, pero toda esta información dentro de una estructura de tablas de la base de datos podría significar un gran consumo de recursos de manera innecesaria.  Desde la actualización SPS 07 de SAP HANA están disponibles los denominados LOBs híbridos, los cuales estarán en memoria sólo cuando son utilizados.

Con los LOB híbridos se puede almacenar datos LOB en el disco hasta que se necesite en lugar de tener que cargarlos en la memoria. Esto influye en el consumo de recursos, por lo tanto afecta a la puesta en marcha del sistema y los tiempos de respuesta. SAP HANA puede almacenar objetos binarios grandes (LOB) en el disco y no dentro de estructuras de columnas o filas de la memoria principal.

Los LOB híbridos residen primero en el disco y se hace referencia a este contenido únicamente por un ID en la columna de la tabla correspondiente. Si hay escasez de memoria, los datos LOB pueden ser descargados desde la memoria principal. A través de unos parámetros del sistema se puede determinar que los datos LOBs pequeños (por defecto, menos de 1.000 bytes) se mantengan en memoria, mientras que los de tamaño superior se mantengan en el disco.

Los cambios que introdujo la actualización SPS 07 de SAP HANA Database sobre los datos LOBs, derivó a que se introdujeran los términos  LOBs de memoria (el mecanismo inicial) y LOBs Híbridos (o LOBS de disco). SAP HANA ofrece un conjunto de sentencias SQL que permiten la parametrización, creación y gestión de estos tipos de datos.

Almacenamiento de gran tamaño en SAP HANA: Campos LOBs

Si estas necesitando almacenar contenidos de gran tamaño, tales como documentos o imágenes en una plataforma SAP HANA Database, debes pensar en los tipos de datos LObs (Large Objetcs), especialmente diseñados para este fin. Existen los siguientes tipos:


Si estas necesitando almacenar contenidos de gran tamaño, tales como documentos o imágenes en una plataforma SAP HANA Database, debes pensar en los tipos de datos LObs (Large Objetcs), especialmente diseñados para este fin. Existen los siguientes tipos:

  • BLOB: Datos binarios. Por ejemplo, imágenes. Para tablas con almacenamiento por filas y columnas.
  • CLOB: Texto ASCII. Para tablas con almacenamiento por filas y columnas.
  • NCLOB: Texto UNICODE. Para tablas con almacenamiento por filas y columnas.
  • TEXT: Texto con características adicionales de búsqueda. Sólo para tablas columnares. Muchas funciones de cadenas no son aplicables a este tipo de dato.
  • BINTEXT: Texto y datos binarios con características adicionales de búsqueda. Con similares restricciones al tipo TEXT.  La definición de este tipo de dato genera una columna de tipo NCLOB.
  • Nota: El tipo de dato VARBINARY, a pesar que puede almacenar hasta 5.000 bytes no es considerado un tipo LOB, por lo que se carga en memoria cuando se acceda sin ninguna restricción como las que se podrían aplicar con los LOBs híbridos, señalados en próxima entrada.

Restricciones de los tipos de datos LObs

  • Un campo de un tipo LOB sólo puede tener un máximo de 2 GB. Hay alertas que permiten controlar esta situación (Check ID 450 – Tables with memory LOBs > 2 GB).
  • Una columna LOB no puede ser utilizada con la cláusula ORDER BY, GROUP BY, SLECT DISTINC, SELECT con funciones de agregación, FROM como operando en joins.
  • Una columna LOB no puede ser clave primaria

Tratamientos de cadena soportados

  • LENGTH para los tipos CLOB, NCLOB y BLOB. Retorna el tamaño de campo LOB en bytes.
  • SUBSTR para los tipos CLOB y NCLOB. Retorna una subcadena del campo LOB.
  • Las clausulas LIKE y CONTAINS para los tipos CLOB y NCLOB.
  • Cláusula IS NUL sólo para los tipos CLOB, NCLOB y BLOB.

Nota: Ver siguiente entrada sobre LOBs híbridos.

Referencia: SAP Note 2220627

SAP EPM Add-in 10.0 SP26, no para todas las instalaciones

Algunas instalaciones de SAP BPC 10.0 NW no tienen problemas para adoptar con rapidez cualquier nueva actualización de la aplicación cliente SAP EPM Add-In, esto es posible, en gran parte, porque tienen pocos o ningún formulario implementado con código Visual Basic for Application (Macros para Excel), unos de los principales riesgos…


Algunas instalaciones de SAP BPC 10.0 NW no tienen problemas para adoptar con rapidez cualquier nueva actualización de la aplicación cliente SAP EPM Add-In, esto es posible, en gran parte, porque tienen pocos o ningún formulario implementado con código Visual Basic for Application (Macros para Excel), unos de los principales riesgos cuando llega una actualización de este complemento, que en ocasiones traen cambios en la API que se “descubren” posteriormente.

La reciente actualización del EPM Add-In (y futuras actualizaciones) conllevan un motivo, poco frecuente, que podría frenar su rápida adopción. Este complemento requiere que se disponga de SAP NW BW 7.4 SP15 o superior, de lo contrario se podría tener un comportamiento anómalo de la herramienta.

Como alternativa a la aplicación de la actualización de BW 7.4, se señala la posibilidad de aplicar las notas necesarias de cada SP, desde el SP09 al SP15.

Referencia: SAP Note 2148240