Luego de la migración de BW sobre HANA, no olvides convertir los infocubos

Una vez realizada la migración de SAP NetWeaver BW a un sistema SAP HANA, BW on HANA podría ser utilizado para realizar las operaciones habituales sin ninguna restricción, pero este escenario no sería nada recomendable. Realizada la migración, el siguiente paso debería ser convertir los infocubos tradicionales de SAP NW BW a infocubos optimizados para SAP HANA (SAP HANA Optimized InfoCubes) para obtener el máximo rendimiento en las tareas de cargas de datos y reporting.


Una vez realizada la migración de SAP NetWeaver BW a un sistema SAP HANA, BW on HANA podría ser utilizado para realizar las operaciones habituales sin ninguna restricción, pero este escenario no sería nada recomendable.  Realizada la migración, el siguiente paso debería ser convertir los infocubos tradicionales de SAP NW BW a infocubos optimizados para SAP HANA (SAP HANA Optimized InfoCubes) para obtener el máximo rendimiento en las tareas de cargas de datos y reporting.

Ventana de la transacción RSMIGRHANADB o el programa RSDRI_CONVERT_ CUBE_TO_INMEMORY para convertir infocubos tradicionales a infocubos optimizados para HANA

Utilizando la transacción RSMIGRHANADB o el programa RSDRI_CONVERT_ CUBE_TO_INMEMORY, visualizaremos una ventana similar a la adjunta a esta entrada y dónde podremos elegir el infocubo que deseamos convertir.  El proceso de conversión se ejecuta en segundo plano, este proceso remueve las tablas de dimensiones para que las tablas de datos maestros estén directamente vinculadas a la tabla de hechos F (post relacionado).

HANABPC cada vez marca más diferencias con la edición NetWeaver de SAP BPC

De la edición Microsoft de SAP BPC (SAP Business Planning and Consolidation) surgió la edición NetWeaver de SAP BPC, a fecha de hoy, con importantes diferencias entre ambas ediciones (evitamos confundir entre el término edición y versión, este último denota nivel de actualización y el primero indica para que plataforma está diseñado). Desde hace más de un año contamos con el componente HANABPC, el cual surge de la edición NetWeaver de SAP BPC como un apéndice que permite maximizar el uso de HANA Database para la ejecución de la lógica diseñada en BPC.


De la edición Microsoft de SAP BPC (SAP Business Planning and Consolidation) surgió la edición NetWeaver de SAP BPC, a fecha de hoy, con importantes diferencias entre ambas ediciones (evitamos confundir entre el término edición y versión, este último denota nivel de actualización y el primero indica para que plataforma está diseñado). Desde hace más de un año contamos con el componente HANABPC, el cual surge de la edición NetWeaver de SAP BPC como un apéndice que permite maximizar el uso de HANA Database para la ejecución de la lógica diseñada en BPC.

Las primeras actualizaciones de SAP Business Planning and Consolidadion powered by SAP HANA (HANABPC) estaban dirigidas a estabilizar este nuevo componente, es los últimos service pack, ptchs y notas vemos que además de corregir errores, propios de un producto nuevo, se presentan novedades o nuevas funcionalidades exclusivas, como la “Desagregación de datos” (aquí un post sobre este tema).  La última novedad que sólo contaremos en HANABPC es un monitor de las operaciones de Desagregación en el cual podremos observar los tiempos y el motor que las procesa (HANA o ABAP).

A nuestro parecer HANABPC, de componente o complemento se convertirá en una edición de SAP BPC que irá marcando importantes diferencias con la edición NetWeaver, beneficiosa siempre y cuando nuestro diseño de nuestras soluciones se enmarque en la arquitectura BPC.

Referencias: SAP Note 1910359 – Monitor and trace disaggregation and allocation in BPC HANA

En la predicción como en el Big Data, el tamaño sí importa

La estadística y la minería de datos no son sinónimo de exactitud, a través de estas técnicas no se obtendrá certezas, si son correctamente utilizadas, se obtendrán buenas aproximaciones. Cuando se señala, por ejemplo, que de cada 10 personas 6 aceptarían un nuevo producto, no es lo mismo indicar esta afirmación si se llega a esta conclusión con un estudio realizado sobre 100 personas que realizado sobre 1.000.000.


La estadística y la minería de datos no son sinónimo de exactitud, a través de estas técnicas no se obtendrá certezas, si son correctamente utilizadas, se obtendrán buenas aproximaciones. Cuando se señala, por ejemplo, que de cada 10 personas 6 aceptarían un nuevo producto, no es lo mismo indicar esta afirmación si se llega a esta conclusión con un estudio realizado sobre 100 personas que realizado sobre 1.000.000.

Las posibilidades que una afirmación, como el ejemplo señalado en el párrafo anterior, se repita o sea más aproximada a la realidad, dependerán del tamaño de la muestra del estudio, es decir, que volumen de subconjunto global de datos se está utilizando (tamaño de la muestra). Para cualquier estudio será imposible obtener información de todo un público objetivo, pero si la muestra es lo suficientemente grande,  el denominado “margen de error” o “error de muestreo” será más pequeño.

El margen de error nos señala en que porcentaje podría variar una predicción o estimación si el tamaño de la muestra variaría.  Mientras más datos analicemos, habrá menores posibilidades de encontrar en la realidad datos distintos o no incluidos en nuestro estudio, asumiendo, en todo momento, que los datos han sido recopilados siguiendo pautas adecuadas, por consiguiente son válidos y fiables.

Cuando señalamos que es tiempo de Big Data, no lo señalamos porque está de moda mencionarlo, sino porque hoy, a diferencias de épocas pasadas, se cuenta con la capacidad de incluir en el procesamiento de la información la mayor cantidad de datos posible, indispensable para las tareas análisis como la predicción.

SAP HANA Forum, BCN 31 Oct 2013

El próximo 31 de octubre de 2013, en Barcelona, se realizará el primer Forum internacional sobre SAP HANA en España, una jornada en donde se podrá conocer más de esta tecnología, usos, novedades y planes de futuro.


El próximo 31 de octubre de 2013, en Barcelona, se realizará el primer Forum internacional sobre SAP HANA en España, una jornada en donde se podrá conocer más de esta tecnología, usos, novedades y planes de futuro.

SAP HANA Forum, en Barcelona el 31 de octubre 2013

¿Qué es SAP HANA?

Es la tecnología de SAP que combina hardware y software que posibilita el procesamiento en memoria (in-memory computing)

 ¿Qué es in-memory computing ?

La computación o procesamiento en memoria es la técnica que consiste en mantener los datos en la memoria RAM, lo más próximo a las CPUs, eliminando cualquier interacción con dispositivos mecánicos o electromecánicos como los discos duros, disminuyendo considerablemente el tráfico de datos durante las tareas de tratamiento de la información.

¿Qué conforma SAP HANA?

Todo el software y hardware de SAP HANA está preparado para la tecnología in-Memory Computing, algunos elementos gestionan el almacenamiento de datos y otros los procesan o facilitan su procesamiento. Los siguientes son los principales elementos que lo componen:

  • SAP HANA Appliance. Es el hardware certificado por SAP para utilizar HANA. Estos equipos los proveen ciertos fabricantes con diversas configuraciones pero que cumplen determinadas exigencias como el uso de procesadores INTEL específicos.
  • SAP HANA Database. Señalado como el corazón de esta tecnología. Es la primera BBDD in-memory computing. Comprende la ingeniería necesaria para que todos los datos que se esperan utilizar estén en memoria para agilizar su procesamiento. A través de tareas en segundo plano, los datos son constantemente respaldados en disco para evitar su perdida si fallara el suministro eléctrico.
  • SAP HANA Studio. Es la consola multipropósito que permite, a través de fichas (perspectivas), realizar las tareas administrativas, seguridad, modelado de datos, programación, monitorización, y otras actividades que se requieran. Estas perspectivas se pueden activar si se cuenta con las autorizaciones adecuadas.
  • SAP HANA Extended Application Services (HANA XS) Es el servidor y contenedor de aplicaciones Web que permite albergar aplicaciones desarrolladas a medida para que utilicen el procesamiento en memoria de HANA.

 ¿Por qué SAP HANA Database es la mejore BBDD?

Además de tener los datos constantemente en memoria, las claves de éxito de HANA son los siguientes:

  • Uso dual de almacenamiento columnar y relacional.
  • Compresión de datos en memoria.
  • Procesamiento en Paralelo (varios procesos ejecutándose simultáneamente en distintos CPUs o partes de un mismo proceso ejecutándose en varios CPUs)

En una palabra ¿Qué es SAP HANA?

Es una plataforma. HANA brinda toda la infraestructura necesaria para desarrollar o implementar la nueva generación de aplicaciones de negocio que brindarán respuesta en tiempo real.  Los principales productos SAP que nos permiten obtener los mejores beneficios de la tecnología HANA son los siguientes:

  •  SAP Suite powered by SAP HANA (incluye ERP y CRM entre otros components)
  • SAP NW BW powered by SAP HANA (BW on HANA)
  • SAP BusinessObjects Business Intelligence 4.0/4.1 (Para acceder a datos HANA y BW on HANA)

 ¿Qué partners de hardware HANA existen?

El hardware para HANA es validado por SAP,  lo proveen determinados partners: IBM, HP, Fujitsu, Hitachi, Dell y Huawei (el último en integrarse a esta lista).  A pesar que deben cumplir ciertos criterios como el uso de procesadores Intel (Nehalem EX y Westmere EX E7), hay importantes diferencias entre ellos, tales como las posibilidades de ampliación de la memoria, configuración de discos o las configuraciones en más de un nodo (scale-out).  Particularmente, por la innovación constante, apostamos por IBM como partner de hardware SAP HANA.

Las claves de la eficiencia de la tecnología columnar

Con la expresión «tecnología columnar» nos referimos a las técnicas de almacenamiento de los datos por columnas, incluida en las alternativas más actuales de base de datos como SAP HANA Database y SAP Sybase IQ, propuesta de base de datos para fines analíticos y de data warehouse de SAP.


Con la expresión «tecnología columnar» nos referimos a las técnicas de almacenamiento de los datos por columnas, característica incluida en las alternativas más actuales de base de datos como esel caso de SAP HANA Database y SAP Sybase IQ, propuesta de base de datos para fines analíticos y de data warehouse de SAP.

La mejor eficiencia que proporciona el almacenamiento por columnas en entornos analíticos, podríamos resumirlos en los siguientes aspectos:

  • Más rapidez. Las consultas analíticas se basan en el ordenamiento, agrupación, clasificación o elaboración de rankings de la información, para lo cual se accede a campos o columnas de datos. Las tablas basadas en el almacenamiento en columnas, además de contener los datos en esta estructura, cuentan con índices que señalan la ubicación de los valores en cada columna. Este hecho facilita la recuperación de los datos consultados, sin tener que acceder a toda las filas de datos de una tabla (tal como sucede en un esquema relacional). Finalmente, todo esto redunda en un menor consumo de CPU y en menores tiempos de respuesta.
  • Menor espacio. Con la tecnología columnar los valores similares en cada columna son sustituidos por claves más pequeñas que requieren menos espacio que el valor original.  Como resultado final, el almacenamiento de una tabla puede reducirse en una proporción entre 3x a 7x, aunque este ratio puede variar considerablemente dependiendo de los valores repetidos y del tipo de dato que se almacene.

La tecnología columnar no es mejor que la relacional, cada una tiene un mejor uso recomendable, ya sea en un entorno analítico o transaccional, respectivamente (aquí post relacionado)