Objetivo In-memory computing (SAP HANA): Mover los datos lo menos posible

Para lograr tiempos de respuesta reales la tecnología In-Memory Computing se vale de una serie de técnicas que tienen por objetivo mover lo menos posible los datos en las bases de datos y entre la base de datos y las aplicaciones.


Para lograr tiempos de respuesta reales la tecnología In-Memory Computing se vale de una serie de técnicas que tienen por objetivo mover lo menos posible los datos en las bases de datos y entre la base de datos y las aplicaciones.

Compresión

A pesar que se pueda contar con grandes cantidades de memoria, con la compresión se persigue evitar el tránsito de los datos. Una técnica habitual es el uso de diccionarios, un método sencillo, porque al final, de lo que se trata es no sobrecargar la capacidad de procesamiento del CPU. Esta técnica consiste en sustituir los textos y fechas por números enteros, tal como se muestra en la siguiente imagen:

Con esta técnica se consigue un factor de compresión que depende de la cantidad de valores distintos. Hay otras técnicas más eficientes, pero lo que se busca es un método flexible que no afecte el tiempo de respuesta al acceder a los datos.

Almacenamiento en Columnas

El almacenamiento basado en columnas (column-based, columnar storage o columnar) es una alternativa al tradicional sistema de bases de datos relacional con su almacenamiento basado en filas.

Como se puede ver en el anterior cuadro, las debilidades del almacenamiento basado en columnas están en las operaciones de actualización e inserción de datos, la tarea menos habitual en un entorno de análisis.

Lógica de aplicaciones en bases de datos

Las técnicas anteriores están enfocadas a agilizar el acceso a la información contenida en las bases de datos.  Pero las aplicaciones pueden realizar operaciones con los datos, generando un «tráfico» de ida y vuelta que puede repercutir en el rendimiento general, aumentando los tiempos de latencia o espera.  Para evitar estos inconvenientes, los cálculos u operaciones que requieren las aplicaciones son procesados en donde están los datos (BBDD).

En «in-memory computing» (técnica de SAP HANA), los datos están en disco

Se entiende por in-memory computing, el procesamiento de grandes cantidades de datos en la memoria principal (RAM) para ofrecer resultados inmediatos en las transacciones y tareas de análisis. El llamado procesamiento en tiempo real es posible por la aplicación de los siguientes principios


Se entiende por in-memory computing, el procesamiento de grandes cantidades de datos en la memoria principal (RAM) para ofrecer resultados inmediatos en las transacciones  y tareas de análisis.  El  llamado procesamiento en tiempo real es posible por la aplicación de los siguientes principios:

  • Mantener los datos en la memoria principal para acelerar el acceso a la información.
  • Reducir el mínimo el movimiento de datos, aprovechando técnicas de almacenamiento en columnas, compresión y cálculos a nivel de base de datos.
  • Maximizar el uso de la arquitectura tales como los procesadores multi-core, entornos distribuido o procesamiento multiservidor.

 La respuesta a la pregunta ¿por qué utilizar la memoria como almacén de datos? se encuentra en el siguiente gráfico:

Las dos primeras alternativas son más rápidas pero se limitan al procesamiento de datos.  La memora RAM es la única, de las alternativas más rápidas, que permite el almacenamiento de un gran volumen de datos.

Podría pensar que tener los datos en memoria es un»riesgo» si se pierde la fuente de alimentación de energía, pero tal riesgo no existe: «El almacenamiento utilizado por una base de datos para guardar los datos (en este caso en la memoria) se divide en páginas. Cuando una transacción cambia los datos, las páginas correspondientes se marcan y se escriben en almacenamiento  no volátil en intervalos regulares». Esto asegura que todas las transacciones son permanentes.

La evolución de las tecnologías SAP para llegar a HANA

IBM es uno de los cinco socios de hardware que tiene SAP para SAP HANA, el denominado “Gigante Azul”, recientemente ha publicado un libro sobre la tecnología de procesamiento en memoria (in-memory computing) y HANA, en pocas páginas plasma importante información sobre la evolución, principales conceptos y características técnicas de esta tecnología sobre la arquitectura de IBM.


IBM es uno de los cinco socios de hardware que tiene SAP para SAP HANA, el denominado “Gigante Azul”, recientemente ha publicado un libro sobre la tecnología de procesamiento en memoria (in-memory computing) y HANA, en pocas páginas plasma importante información sobre la evolución, principales conceptos y características técnicas de esta tecnología sobre la arquitectura de IBM.

SAP HANA no es un “invento reciente”, es el resultado de la evolución de varias tecnologías que han confluido en un producto que inicialmente fue pensado sólo para mejorar las tareas de análisis de datos, pero que muy pronto, SAP identificó su potencial y cambió su alcance y ahora está llamada a ser la base de datos y plataforma sobre la que funcionarán todas las aplicaciones de SAP.

Complemento EPM 10.0 revoluciona SAP BPC

Han pasado casi cuatro años desde la adquisición de OutlookSoft, ahora SAP BusinessObjects Planning and Consolidation (SAP BPC), y las “tareas de adaptación” continúan y quizás estemos, con la nueva versión 10.0, con los cambios más significativos. SAP BPC 10.0 edición para Microsoft ha sido liberada pero la edición para Netweaver estará en ramp-up hasta el 16 de marzo (hasta ayer era el 20 de febrero).


Han pasado casi cuatro años desde la adquisición de OutlookSoft, ahora SAP BusinessObjects Planning and Consolidation (SAP BPC), y las “tareas de adaptación” continúan y quizás estemos, con la nueva versión 10.0, con los cambios más significativos. SAP BPC 10.0 edición para Microsoft ha sido liberada pero la edición para Netweaver  estará en ramp-up hasta el 16 de marzo (hasta ayer era el 20 de febrero).

Uno de los cambios más importantes es la sustitución del complemento SAP BPC for Office por otro Add-in, denominado “EPM Add-in for Microsoft Office” o “Complemento EPM para Microsoft”,  el cual se puede utilizar en MS Excel, MS Word y MS PowerPoint para acceder (individual o simultáneamente) a los datos generados por las soluciones del porfolio SAP EPM (Enterprise Performance Management):

  • Cubos SSAS y SAP NW BW creados en SAP BO Financial Consolidation
  • Modelos SAP BO Profitability and Cost Management
  • Modelos SAP BO Planning and Consolidation NW
  • Modelos SAP BO Planning and Consolidation MS

 EPM Add-in vs. BPC for Office

  • El nuevo complemento incluye nuevas ventanas de dialogo.
  • Las acciones propias de la consolidación han sido llevadas al componente Web (Centra Consolidation)
  • Tiene un renovado Panel (antes Panel Action) con más interactividad, es posible crear informes arrastrando las dimensiones desde el panel a la hoja de cálculo.
  • Nuevo EPM Context bar. El contexto (antes Current View) puede seguir viéndose en el  Panel, pero adicionalmente se cuenta con una barra horizontal, la cual puede ser parametrizada.
  • La creación de informes era a través de la función EvDRE, con el complemento EPM es a través de ventanas de dialogo, principalmente por “Report Editor” y “Member Selector” y se establece opciones a través de las ventanas “User Options”, “Sheet Options”, “Options” y “Report Editor”.
  • La funcionalidad de entrar en una celda “=EVDRE()” para llamar el asistente para crear una plantilla no funciona con EPM 10.
  • Con EPM 10 es posible abrir y usar plantillas diseñadas con EvDRE de la versión 7.5, pero con comportamientos diferentes, por ejemplo, opciones que ya no existen como “Override Current View” o el modo/orden en que se recuperan los miembros de dimensión.
  • Se renombran la gran mayoría de funciones «EV» y otras quedan en desuso.
  • La totalidad de macros BPC han  sido renombradas.

 Otras particularidades del componente EPM:

  • Sólo en los modelos BPC es posible la entrada de datos.
  • No todas las funciones son compatibles para todos los tipos de conexiones.
  • Puede utilizarse el complemento EPM con otras conexiones que no sean EPM.
  • Para las conexiones BPC se tiene una fiche Administrador de Datos (Data Manager).
  • Si se trata de abrir un libro EPM donde el complemento no ha sido instalado, podría abrirse un asistente para su instalación.
  • El complemento EPM se carga automáticamente al abrir MS Excel, MS PowerPoint o MS Word.

 ¿Qué hacer?

El complemento EPM 10 trae importantes ventajas, pero la «alegría» de estas novedades dependerá de si ya se ha implementado BPC o si se comenzará con un nuevo proyecto.  Para implementaciones con versiones anteriores podrán utilizar la herramienta de conversión de formularios EVDRE, pero seguro que será necesario revisarlas y ajustarlas.  Sin duda, todo un nuevo proyecto de actualización de versión.

Para nuevos proyectos de planificación y consolidación deberían comenzar con esta versión, porque de otro modo, tendríamos en el futuro inmediato, otro proyecto para el cambio de versión.

Buscando una debilidad en la fortaleza de SAP

Siguiendo la idea de nuestro post anterior, por ejemplo, para encontrar la debilidad de SAP, primero habría que identificar su fortaleza. Tal vez seamos un poco superficiales, pero consideramos que la principal fortaleza de SAP es la uniformidad de funcionamiento e integración de datos entre sus componentes.


Siguiendo la idea de nuestro post anterior, por ejemplo, para encontrar la debilidad de SAP, primero habría que identificar su fortaleza.  Tal vez seamos un poco superficiales, pero consideramos que la principal fortaleza de SAP es la uniformidad de funcionamiento e integración de datos entre sus componentes.

Uniformidad e Integración, ¿fortaleza y debilidad?

Quizás por ello, cuando SAP adquiere un nuevo producto, se afane en remodelar su interfaz, crear canales para que sus datos sean fácilmente leídos y si es posible, lo renombra.  Lógico, esto no puede ser de inmediato, mientras tanto, entre la versión “X” y la “X+ n”, ya ha habido varios usuarios que han implementado la herramienta y al finalizar SAP las “tareas de adaptación”, los usuarios ven que algunas funcionalidades han sido mejoradas o tienen la categorías de “obsoletas”, el primer paso para que en la siguiente versión desaparezcan.

Esta situación la hemos visto en SAP BusinessObjects y SAP BPC, las herramientas que habitualmente utilizamos.  De todo el trabajo que SAP está haciendo actualmente, nos llama la atención los cambios que traerá SAP BPC 10, aun en rampup.  Particularmente uno, la función EvDRE pasa a la categoría de obsoleta.  Actualmente, gracias a esta función, es posible implementar la serie de exigencias de los usuarios en los formularios o plantillas en un proyecto de planificación, tan variopinto en cada organización.

Aún no hemos probado la nueva versión de SAP BPC 10, esperamos que las nuevas funcionalidades sea igual de flexibles, porque leyendo la nota técnica que adjuntamos, nos hace pensar que flexibilidad con el trabajo hecho con versiones anteriores tendrá muy poco, veremos cómo evoluciona el rampup… Si Oracle estaba buscando una debilidad, quizás aquí podría tener una.