El Cisne Negro en el BI (II Parte) y la Minería de Datos


Por todos los sucesos que ocurren a diario, difíciles de predecir y desde que leímos las primeras páginas del libro de Nassim Nicholas Taleb, estamos dudando un poco más sobre la efectividad de la Minería de Datos.  El también llamado data mining, es quizás la técnica menos implementada de todas las que componen el Business Intelligence, creemos que se debe por su mayor complejidad y la necesidad de tener unos conocimientos adicionales como la estadística.

Recuperando la definición sobre minería de datos, de una de las mejores fuentes bibliográficas que tenemos de referencia, señala textualmente lo siguiente:

“La minería de datos tiene como objetivo analizar los datos para extraer conocimiento.  Este conocimiento puede ser en forma de relaciones, patrones o reglas inferidas de los datos y (previamente) desconocidos, o bien e forma de una descripción más concisa (es decir, un resumen de los mismos). Estas relaciones o resúmenes constituyen el modelo de datos analizado. Existen muchas formas diferentes de representar los modelos y cada una de ellas determina el tipo de técnica que puede usarse para inferirlos.

En la práctica, los modelos pueden de dos tipo: predictivos o descriptivos.  Los modelos predictivos pretenden estimar valores futuros o desconocidos…

Los modelos descriptivos, en cambio, identifican patrones que explican o resumen los datos, es decir, sirven para explorar las propiedades de los datos examinados,…”

Sobre la categorización o clasificación según patrones, por ejemplo aplicado en las personas, estos se trastocan con mayor celeridad que antes, Internet y todos los fenómenos que conlleva, como las redes sociales, contribuyen a la evolución o abandono de estos patrones en unos cuantos clics, son tantos los datos que se podrían analizar, que la técnica basada en la agrupación y resumen, deja en el camino características particulares de mayor relevancia.

Esta comprobado que la facultad de predicción es inexistente, entidades revisoras de riesgo financiero, gobiernos, Gartner con sus predicciones anuales sobre la tecnología que  se implementará y luego no valora su grado de acierto o el mismo Google, con la cantidad de información que manipula a fracasado con el lanzamiento de más de un producto, el último Google Wave.  Como señala el autor del Cisne Negro, predecir y acertar es cuestión de suerte, no se puede predecir cuando ocurrirá un terremoto, pero si se podría cuantificar sus consecuencias y estar preparados para una reacción inmediata.

No sugerimos que abandonen sus implementaciones de minería de datos, sólo que los modelos generados sean revisados con mayor frecuencia y que el resultado de las conclusiones sean tomandos con una información de referencia, no como la verdad absoluta.

Referencia: (anterior post) El Cisne Negro en el BI (I Parte)

Deja un comentario... Gracias!!!

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s