El Cisne Negro en el BI (II Parte) y la Minería de Datos

Como señala el autor del Cisne Negro, predecir y acertar es cuestión de suerte, no se puede predecir cuando ocurrirá un terremoto, pero si se podría cuantificar sus consecuencias y estar preparados para una reacción inmediata.


Por todos los sucesos que ocurren a diario, difíciles de predecir y desde que leímos las primeras páginas del libro de Nassim Nicholas Taleb, estamos dudando un poco más sobre la efectividad de la Minería de Datos.  El también llamado data mining, es quizás la técnica menos implementada de todas las que componen el Business Intelligence, creemos que se debe por su mayor complejidad y la necesidad de tener unos conocimientos adicionales como la estadística.

Recuperando la definición sobre minería de datos, de una de las mejores fuentes bibliográficas que tenemos de referencia, señala textualmente lo siguiente:

“La minería de datos tiene como objetivo analizar los datos para extraer conocimiento.  Este conocimiento puede ser en forma de relaciones, patrones o reglas inferidas de los datos y (previamente) desconocidos, o bien e forma de una descripción más concisa (es decir, un resumen de los mismos). Estas relaciones o resúmenes constituyen el modelo de datos analizado. Existen muchas formas diferentes de representar los modelos y cada una de ellas determina el tipo de técnica que puede usarse para inferirlos.

En la práctica, los modelos pueden de dos tipo: predictivos o descriptivos.  Los modelos predictivos pretenden estimar valores futuros o desconocidos…

Los modelos descriptivos, en cambio, identifican patrones que explican o resumen los datos, es decir, sirven para explorar las propiedades de los datos examinados,…”

Sobre la categorización o clasificación según patrones, por ejemplo aplicado en las personas, estos se trastocan con mayor celeridad que antes, Internet y todos los fenómenos que conlleva, como las redes sociales, contribuyen a la evolución o abandono de estos patrones en unos cuantos clics, son tantos los datos que se podrían analizar, que la técnica basada en la agrupación y resumen, deja en el camino características particulares de mayor relevancia.

Esta comprobado que la facultad de predicción es inexistente, entidades revisoras de riesgo financiero, gobiernos, Gartner con sus predicciones anuales sobre la tecnología que  se implementará y luego no valora su grado de acierto o el mismo Google, con la cantidad de información que manipula a fracasado con el lanzamiento de más de un producto, el último Google Wave.  Como señala el autor del Cisne Negro, predecir y acertar es cuestión de suerte, no se puede predecir cuando ocurrirá un terremoto, pero si se podría cuantificar sus consecuencias y estar preparados para una reacción inmediata.

No sugerimos que abandonen sus implementaciones de minería de datos, sólo que los modelos generados sean revisados con mayor frecuencia y que el resultado de las conclusiones sean tomandos con una información de referencia, no como la verdad absoluta.

Referencia: (anterior post) El Cisne Negro en el BI (I Parte)

¿PALO de Jedox Vs. BPC de SAP?

En cualquier comparativa, antes de iniciarla, ya se sabrá que producto ofrece más prestaciones, creemos que la utilidad de una comparativa estará dada si se parte identificando las características de la problemática por solucionar y analizando como (facilidad o eficiencia) cada alternativa cubre las necesidades identificadas.


Descabellado o loco, cualquier de esos dos adjetivos estarían bien merecidos si se hicieran una comparativa genérica, sin contextualizarla o enmarcarla en una realidad o necesidades concretas a satisfacer.

En cualquier comparativa, antes de iniciarla, ya se sabrá que producto ofrece más prestaciones, creemos que la utilidad de una comparativa estará dada si se parte identificando las características de la problemática por solucionar y analizando como (facilidad o eficiencia) cada alternativa cubre las necesidades identificadas.

PALO y BPC, han sido desarrolladas para atender las necesidades de planificación, adicionalmente BPC tiene funciones de consolidación financiera. Ambas herramientas se basan en hojas de cálculo Excel para desarrollar lo que será el entorno de trabajo que tendrá el usuario final y utilizan una base de datos multidimensional para almacenar los  datos que introduzca el usuario (datos transaccionales) y los utilizados de referencia para el diseño de plantillas (datos maestros).

PALO tiene una serie de características que nos agradan y que deberían tenerse en consideración en cualquier comparativa:

  • Es un producto Open Source (gratis), inicialmente la versión estándar podría ser suficiente, luego se podría requerir algún componente adicional tipo Premium (de pago).
  • Utiliza una base de datos multidimensional en memoria.  Los tiempos de respuesta de las lecturas y escrituras son muy buenos.
  • Además de la versión para MS Excel, también hay una versión para OpenOffice.
  • El entorno de trabajo es el mismo para el modelado de datos, actualización de datos maestros (miembros), diseño de plantillas y otras tareas de administración: MS Excel.
  • PALO SAP Connectivity, es el componente que permite recuperar y volcar datos en SAP R/3 y SAP BW.

Anteriormente habíamos comentado sobre PALO, gracias a ello conocimos a George Javanovic y su blog Sobre el Software y Otras Hierbas. George, también esta fascinado con este producto por su simplicidad y bajo coste, nos ha contado sobre su experiencia, sobre la cual extraemos los siguientes aspectos:

  • Para un proyecto de planificación para una cadena de retail con 300 establecimientos escogieron PALO de Jedox, previamente lo compararon con Hyperion Planning y los tiempos de implementación eran sustancialmente distintos, la estimación en Hyperion fueron de tres meses y para PALO, tres semanas.
  • Se cuenta con varios recursos de ayuda y consulta como el forum o blog.
  • No cuenta con sofisticas rutinas para realizar tareas de consolidación, pero si se pueden definir ciertas reglas de negocio para la eliminación intercompañia o repartos.
  • Pueden utilizarse herramientas ETL para recuperar datos de fuentes externas.
  • Sobre si echaría en falta alguna característica, nos comentó sobre los workflows pero que lo podría solventar con el diseño de un panel que guíe el proceso.

Resultan interesantes también los vídeos de PALO en la Web del producto y los vídeos, algo más antiguos, publicados en Youtube, pero que demuestran la rapidez y facilidad de despliegue del producto.

Consideramos que PALO, para tareas de planificación, dependiendo las necesidades del usuario y la infraestructura tecnológica existente, puede ser una alternativa comparable a los productos de pago o comerciales más conocidos.

Referencia:

El criterio en la toma de decisiones

Una de las “bondades” que aporta el Business Intelligence, según la información comercial más recurrida es el de “apoyar en la toma de decisiones”, sí, el BI es importante y muy valioso si es bien implementado, sobre todo, donde exista una organización y cultura de toma de decisiones basadas en el buen Criterio, como apunta un libro de del mismo nombre: Con un buen criterio, lo demás importa poco. Sin él, lo demás no importa nada.


Una de las “bondades” que aporta el Business Intelligence, según la información comercial más recurrida es el de “apoyar en la toma de decisiones”, sí, el BI es importante y muy valioso si es bien implementado, sobre todo, donde exista una organización y cultura de toma de decisiones basadas en el buen Criterio, como apunta un libro de del mismo nombre: «Con un buen criterio, lo demás importa poco. Sin él, lo demás no importa nada».

Esta habilidad se desarrolla con el tiempo y experiencia, como señala la bibliografía de referencia: “Debes tener un sentido de la situación… saber cuándo actuar y saber qué hacer. Necesitas Fingerspitzengefühl« (Fingerspitzengefühl es un término alemán que alude al desarrollo del criterio como consecuencia de la experiencia).

De algún modo esta habilidad, la del buen criterio, además de la experiencia como principal vía para desarrollarla, esta el uso de una metodología para tomar decisiones con resultados exitosos, como la que aborda el libro de referencia, porque como señala; «el criterio sólo triunfa cuando el resultado alcanza las metas que se ha marcado la institución. Y punto. El entusiasmo, las buenas intenciones y el trabajo duro pueden ayudar, pero sin buenos resultados, no cuenta nada.» … nos parece recomendable su revisión.

Referencia: ISBN 978-84-493-2380-5

Preguntas para pensar en el Open Source para el BI

Se debe tener presente que el código abierto no siempre es sinónimo de software libre o gratuito, muchas características que se pueden requerir, sólo se ofrecen en las versiones Premium o de pago del producto Open Source.


Forrester ha elaborado un estudio sobre el software abierto en el Business Intelligence, por 1749 dólares se puede acceder a un estudioso detallado de la diferentes alternativas Open Source, disponibles para el BI comparándolas con la oferta comercial o de pago.

Sería interesante contar con dicho estudio, pero nos parecen suficiente las preguntas que sugieren los especialistas de Forrester que deberíamos formularse cuando se este buscando un producto Business Intelligence:

  • ¿Conoces las categorías del BI y las relacionadas al BI de código abierto?
  • ¿Estás buscando un producto que soporta las funcionalidades del BI sólo parcialmente o estás buscando una suite completa de BI con amplias capacidades?
  • ¿Tienes claro las diferencias entre software en comunidad y versiones comerciales?
  • ¿Estas buscando una versión open source, comercial o una combinación entre ambas?

Se debe tener presente que el código abierto no siempre es sinónimo de software libre o gratuito, muchas características que se pueden requerir, sólo se ofrecen en las versiones Premium o de pago del producto Open Source.

Mucho software Open Source, sólo cubre ciertos aspectos del Business Intelligence, reporting y/o cuadros de mando,  por lo tanto no pueden ser catalogadas como suites de BI. Forrester identifica como plataformas de BI de código abierto a las siguientes: BIRT, Jaspersoft, Pentaho y SpagoBI; pero apuntan: “tienen el mismo problemas de sus primos comerciales de BI más grandes, que han adquirido múltiples tecnologías y están luchando con la integración de ellas».

Referencias:

¿Cuánto te vale? … ¿cuánto te cuesta?

Con crisis o sin ella, ya sea porque se tiene un estricto control sobre el presupuesto o por experiencias que sobrepasaron el coste previsto, ¿cuánto? es la primera pregunta que surge en las mentes de los usuarios que deben decidir la adopción de una solución informática.


Con crisis o sin ella, ya sea porque se tiene un estricto control sobre el presupuesto o por experiencias que sobrepasaron el coste previsto, ¿cuánto? es la primera pregunta que surge en las mentes de los usuarios que deben decidir la adopción de una solución informática. Y nos parece muy bien, porque no hay ninguna garantía que una novedad tecnológica aporte, a todas las organizaciones por igual, tanto o más valor que su coste (Warren Buffett: “El precio es lo que se paga, el valor es lo que se obtiene”).

Una forma de despejar estas “dudas”, es identificar los aspectos clave donde se puede aportar valor, un especialista de Massachusetts Institute of Technology (MIT) sugiere una serie de preguntas que deberían formularse para determinar de que manera una propuesta ayudará a obtener valor, en línea con lo que la organización esta buscando o necesitando.  Algunas de las preguntas que sugiere son las siguientes:

Segmentación

  • ¿Quiénes son mis mejores clientes?
  • ¿Qué característica debe tener los clientes señalados como los mejores?
    • Los que aportan mayores ingresos
    • Los que aportan mayores márgenes
    • De los que más se aprende
    • El que más buenas referencias aporta

Posicionamiento

  • ¿Por qué estos clientes no se van a la competencia?
  • ¿Qué motiva a un cliente irse a la competencia?
  • ¿Cuándo captamos un cliente de la competencia?

Procesos

  • ¿Por qué estamos obteniendo estos resultados?
  • ¿Hay algo que se quiere hacer y la tecnología no lo permite?
  • ¿Hay algo que se quiere hacer y los costes son muy elevados?

A partir de estas respuestas, se podría detectar si la propuesta tecnológica ayudará hacer mejor las cosas, pudiendo contar como factor de decisión no tan sólo el coste, sino el valor que se logrará con el cambio.

Referencia: Revistas Deusto