El Cisne Negro en el BI (II Parte) y la Minería de Datos

Como señala el autor del Cisne Negro, predecir y acertar es cuestión de suerte, no se puede predecir cuando ocurrirá un terremoto, pero si se podría cuantificar sus consecuencias y estar preparados para una reacción inmediata.


Por todos los sucesos que ocurren a diario, difíciles de predecir y desde que leímos las primeras páginas del libro de Nassim Nicholas Taleb, estamos dudando un poco más sobre la efectividad de la Minería de Datos.  El también llamado data mining, es quizás la técnica menos implementada de todas las que componen el Business Intelligence, creemos que se debe por su mayor complejidad y la necesidad de tener unos conocimientos adicionales como la estadística.

Recuperando la definición sobre minería de datos, de una de las mejores fuentes bibliográficas que tenemos de referencia, señala textualmente lo siguiente:

“La minería de datos tiene como objetivo analizar los datos para extraer conocimiento.  Este conocimiento puede ser en forma de relaciones, patrones o reglas inferidas de los datos y (previamente) desconocidos, o bien e forma de una descripción más concisa (es decir, un resumen de los mismos). Estas relaciones o resúmenes constituyen el modelo de datos analizado. Existen muchas formas diferentes de representar los modelos y cada una de ellas determina el tipo de técnica que puede usarse para inferirlos.

En la práctica, los modelos pueden de dos tipo: predictivos o descriptivos.  Los modelos predictivos pretenden estimar valores futuros o desconocidos…

Los modelos descriptivos, en cambio, identifican patrones que explican o resumen los datos, es decir, sirven para explorar las propiedades de los datos examinados,…”

Sobre la categorización o clasificación según patrones, por ejemplo aplicado en las personas, estos se trastocan con mayor celeridad que antes, Internet y todos los fenómenos que conlleva, como las redes sociales, contribuyen a la evolución o abandono de estos patrones en unos cuantos clics, son tantos los datos que se podrían analizar, que la técnica basada en la agrupación y resumen, deja en el camino características particulares de mayor relevancia.

Esta comprobado que la facultad de predicción es inexistente, entidades revisoras de riesgo financiero, gobiernos, Gartner con sus predicciones anuales sobre la tecnología que  se implementará y luego no valora su grado de acierto o el mismo Google, con la cantidad de información que manipula a fracasado con el lanzamiento de más de un producto, el último Google Wave.  Como señala el autor del Cisne Negro, predecir y acertar es cuestión de suerte, no se puede predecir cuando ocurrirá un terremoto, pero si se podría cuantificar sus consecuencias y estar preparados para una reacción inmediata.

No sugerimos que abandonen sus implementaciones de minería de datos, sólo que los modelos generados sean revisados con mayor frecuencia y que el resultado de las conclusiones sean tomandos con una información de referencia, no como la verdad absoluta.

Referencia: (anterior post) El Cisne Negro en el BI (I Parte)

El Cisne Negro en el BI (I Parte)

¿La evaluación de los sucesos del pasado, hechos conocidos, pueden ser suficientes para conocer o “predecir” los sucesos del futuro, hechos por conocer?, este uno de los tantos cuestionamientos que se plantea Nassim Nicholas Taleb en su obra El Cisne Negro.


¿La evaluación de los sucesos del pasado, hechos conocidos, pueden ser suficiente para conocer o “predecir” los sucesos del futuro, hechos por conocer?, este uno de los tantos cuestionamientos que se plantea Nassim Nicholas Taleb en su obra El Cisne Negro.

Un  Cisne Negro, término acuñado por el autor, es una rareza, un hecho fuera del alcance de las “expectativas normales” el cual tiene las siguientes tres características:

  • Nada del pasado puede apuntar de forma convincente de su posibilidad.
  • Produce un gran impacto.
  • Después de producido el hecho, surgen las explicaciones y se convierte en un hecho predecible

La forma en como analizamos los hechos, el afán por corroborar nuestros supuestos, el conocimiento inductivo, la búsqueda de la simplificación a través de la categorización, la apreciación de los hechos por contagio o proximidad, entre otros aspectos, según el Nassim, nos hacen dejar en el camino hechos relevantes que nos podrían dar otra visión de más utilidad.

Sin duda, viendo la coyuntura actual, el autor de esta obra, tiene algo o bastante de razón.  Talvez, estemos viviendo las consecuencias de un gran Cisne Negro que nadie pudo predecir , ha ocasionado un gran impacto y ahora, ocurrido los hechos, tenemos a nuestra disposición inmensas bibliotecas explicándonos los hechos, desde los antecedentes, causas y recetas para que no vuelva ocurrir.

El Cisne Negro nos parece una obra muy interesante, altamente recomendable, estamos en mitad de su lectura, vamos apuntando algunos tweets de los conceptos que nos parecen más relevantes (aquí).  Creemos que existen muchas ideas que podrían ser útiles y aplicables en el Business Intelligence, sobre todo, para un planteamiento nuevo y útil que contemple un análisis más amplio y productivo.

Volveremos a comentar sobre este libro, por lo pronto, resaltamos la siguiente sugerencia: “La estrategia es juguetear cuanto sea posible y tratar de reunir tantas oportunidades de «Cisne Negro» como se pueda”.  La cual interpretamos, desde nuestra perspectiva de Business Intelligence, como la obligación de elaborar tantos escenarios como sean posibles, sin descartar ninguno, sin antes, no valorarlo minuciosamente.

Referencia: