KDD, marco de trabajo para la minería de datos

En momentos en que las técnicas de análisis avanzando ganan mayor protagonismo, tales como las que se incluyen en las herramientas de minería de datos, es oportuno recordar el marco de trabajo en las que mejor se utiliza como el “Proceso de extracción de conocimiento a partir de datos” (KDD Knowledge Discovery in Databases).


En momentos en que las técnicas de análisis avanzando ganan mayor protagonismo, tales como las que se incluyen en las herramientas de minería de datos, es oportuno recordar el marco de trabajo en las que mejor se utiliza como el “Proceso de extracción de conocimiento a partir de datos” (KDD Knowledge Discovery in Databases).

Encontramos este esquema en una publicación que explica paso a paso el uso de SPSS, la herramienta de análisis y minería datos más importante, propiedad de IBM, utilizada por otros fabricantes de software para desarrollar sus aplicaciones de Data Mining.  En el caso de SAP, tenemos a SAP BusinessObjects Predictive Workbench.

Referencia: (aquí)

«BI Launch Pad»: Para mejorar el acceso a los documentos BI

Nuestro post anterior suscito un comentario que nos resulto difícil contradecir, sobre la poca eficiente gestión de documentos que puede tener SAP BusinessObjects XI 3.1 y versiones anteriores. Pero nos parece que este posible problema no es sólo de un fabricante de BI sino de la gran mayoría.


Nuestro post anterior suscito un comentario que nos resulto difícil contradecir, sobre la poca eficiente gestión de documentos que puede tener SAP BusinessObjects XI 3.1 y versiones anteriores.  Pero nos parece que este posible problema no es sólo de un fabricante de BI sino de la gran mayoría.

Si los usuarios de una plataforma de BI tienen la posibilidad de crear documentos (¡viva el Self Service BI!) podrían estar acumulándose innecesario una serie de objetos que dificultarían el acceso a los documentos realmente valiosos para el usuario.

Pero desde nuestro parecer, este problema no se originaría únicamente por limitaciones en el software, consideramos que los siguientes aspectos influyen en esta situación:

  • Desconocimiento por parte de los administradores de las posibilidades que ofrece la herramienta para la gestión de documentos.
  • Excesivo celo en la seguridad, imposibilitando compartir documentos entre los usuarios, convirtiendo a cada usuario en una potencial “isla de documentos”.
  • Falta de comunicación de los documentos públicos disponibles o falta de documentación de los mismos.
  • Falta de tareas de control y mantenimiento de los objetos obsoletos, en desuso o desvinculados.

Hasta la versión actual de SAP BusinessObjects, la XI 3.1, el componente que esta a disposición de los usuarios para gestionar sus documentos es InfoView que en la nueva versión (4.0) será sustituido por “BI Launch Pad” que traducido se le conocerá como “Plataforma de Lanzamiento de BI” (nos quedamos con el nombre en inglés), este nuevo componente incluirá nuevas características para facilitar el acceso a los documentos de BI.

Cuidado, peligro: Capas semánticas diseñadas por técnicos

En una plataforma de Business Intelligence utilizamos la expresión “capa semántica” para referirnos al mecanismo, procedimiento o sistema que nos permitirá acceder a los datos sin la necesidad de conocer su ubicación o denominación técnica. Nombres o términos de uso más frecuente en la gestión del negocio son utilizados para especificar los datos que se desean incluir en un informe o un cuadro de mando.


En una plataforma de Business Intelligence utilizamos la expresión “capa semántica” para referirnos al mecanismo, procedimiento o sistema que nos permitirá acceder a los datos sin la necesidad de conocer su ubicación o denominación técnica.  Nombres o términos de uso más frecuente en la gestión del negocio son utilizados para especificar los datos que se desean incluir en un informe o en un cuadro de mando.

Suena muy bien que el usuario de negocios no necesite aprenderse los nombres nemotécnicos que los informáticos empleamos para definir la estructura física de las bases de datos.  Pero en la práctica, que el usuario pueda identificar los datos que requiera en el “lenguaje” que esta habituado a emplear, no es suficiente.

En busca del Universo perfecto

En SAP BusinessObjects la “capa semántica” se denomina universos.  No resulta difícil encontrar universos en las que se intuye una participación muy baja del usuario de negocios en el diseño de los mismos.  Estos Universos se caracterizan porque contienen los términos que los usuarios finales utilizan, pero el modo de organizarlos y la definición de tantos universos como unidades o áreas existen en la organización no constituyen de mucha ayuda al diseñar nuevos documentos.

El objeto de análisis del usuario no esta circunscrito a un área, generalmente cubren procesos en las que intervienen diferentes unidades de negocio.  Pero esto lo sabe el usuario final quien en definitiva debe determinar la estructura de los universos que requiera.  De este modo evitaríamos las complejas tareas de diseño de documentos utilizando cuatro o más universos y exportaciones a ficheros Excel para obtener el resultado deseado.

MicroStrategy Transaction Services: Superando las barreras del BI

Entendemos por Business Intelligence a un conjunto de técnicas y herramientas que facilitan la presentación de los datos para su lectura, comprensión y análisis. A partir del análisis que se realice las acciones que emprenda el usuario estarán determinadas por muchos factores que consideramos que están fuera del alcance del BI, llámese sentido común, oportunidad, intuición, coyuntura, contexto, etc


Para nosotros, el Business Intelligence (BI) es un conjunto de técnicas y herramientas que facilitan la presentación de los datos para su lectura, comprensión y análisis.  A partir del análisis que se realice, las acciones que emprenda el usuario estarán determinadas por muchos otros factores que consideramos están fuera del alcance del BI, llámese criterio, sentido común, oportunidad, intuición, coyuntura, contexto, etc.

Pretender definir las acciones que debería tomar el usuario según los valores que se reflejen en un cuadro de mando, consideramos que están ambicioso como  inútil para los gestores de negocios.  Nos parece innecesario ambicionar tal grado de automatismo en la toma de decisiones, considerando que hay muchos factores que no se pueden recoger en una plataforma de Business Intelligence, sobre todo en esta «nueva realidad» con variables o parámetros que entran y salen en todos los modelos de negocio, todos los días.  Al final, es el criterio de que utilice cada individuo en su toma de decisiones el que marcará la diferencia de una organización.

Sin conocer mucho el producto, porque al parecer sólo se tiene un anuncio del próximo Microstrategy Transaction Services, pero por lo poco que hemos leído del mismo, no creemos que una solución que pretenda automatizar las acciones de los usuarios contribuya al desarrollo del buen criterio de las personas o aporte una ventaja competitiva a las empresas.

Referencia: MicroStrategy

¿Business Intelligence o Business Analytics?

Este debate ya tiene algunos años, pero en los últimos días ha recobrado impulso en SAP SDN, entre otros aspectos por las opiniones de Gartner en las que advierte que se le debería prestar mayor atención al Business Analytics, debido a que es una categoría de productos cuya demanda está creciendo por el nuevo panorama al que se enfrentan los gestores de las organizaciones, más propenso a la variaciones o cambios y al parecer es el mejor instrumento para gestionarlo.


Este debate ya tiene algunos años, pero en los últimos días ha recobrado impulso en SAP SDN, entre otros aspectos por las opiniones de Gartner  en las que advierte que se le debería prestar  mayor atención al Business Analytics, debido a que es una categoría de productos cuya demanda está creciendo por el nuevo panorama al que se enfrentan los gestores de las organizaciones, más propenso a la variaciones o cambios y al parecer es el mejor instrumento para gestionarlo.

En principio también considero  que detrás de esta discusión semántica hay un componente comercial que trata de establecer una frontera dentro de una misma disciplina como el Business Intelligence (BI) y que el Business Analytics (BA), es  una evolución del BI, con nuevas característica, nuevas funcionalidades y otra perspectiva de consumir la información, pero el interés comercial requiere marcar diferencias, con el que ahora se denomina BI tradicional.

Tratando de evitar los clichés, el BI es un conjunto de técnicas que permiten presentar los datos para facilitar la comprensión de la información y puedan ser utilizados en la gestión de las organizaciones.  Entre los principales recursos tenemos los informes (reporting), cuadros de mando (scorecards y dashboard), minería de datos (data mining) y el análisis OLAP (exploración de las fuentes de datos multidimensionales).

El Business Analytics también tiene el mismo fin, facilitar la comprensión de lo que sucede. Pero en teoría tiene un origen y contexto diferente. Identificamos los siguientes aspectos:

  • El BI parte de unas necesidades puntuales y conocidas, por su parte el BA es la propuesta para atender las demandas o necesidades que puedan surgir en cualquier nuevo panorama (la pregunta inesperada).
  • Los usuarios del BI siguen teniendo la necesidad de llevar su contenido a una hoja de cálculo Excel para profundizar su análisis. El BA ofrece los instrumentos para facilitar ese análisis sin que tenga que recurrir a otras herramientas.
  • El BI tiene una serie de recursos preestablecidos y la interacción con los datos es limitada y el BA se caracteriza por su facilidad de uso y amigabilidad, es por ello que sus principales impulsores sean los usuarios de negocio.
  • El BI tiene en la agregación de datos su principal punto de partida para presentar la información, el BA requiere del detalle para dar respuesta a la interrogante planteada.

El BA utiliza una serie de recursos del denominado BI tradicional, que justificarían su presentación como un componente del BI, desde nuestro parecer el BA es un “mix” de análisis OLAP, escenarios (cuadros de mando) y minería de datos. Pero comercialmente hablando, ningún fabricante de software de BI cometería la “locura” de decir que no tiene BA.  El BA es una tendencia, un reclamo de los usuarios que buscan la diferenciación y merita, desde el punto de vista comercial, otro «paraguas».

En el caso de SAP BusinessObjects, tenemos productos que se encuadran en la categoría de Business Analytics, estos son SAP BusinessObjects Explorer y SAP BusinessObjects Analysis, este último que viene ser la evolución y combinación del BEx y el Voyager.

Referencia: CIO y SAP SDN