Archivo diario: 10 agosto, 2009

Minería de Datos, ¿Lo necesito?


Pasado el temporal, se analiza y se concluye, que si se hubiera hecho un mejor uso de la información, muchas organizaciones hubieran podido gestionar mejor la situación.  En este sentido, el Business Intelligence y un poco más, la minería de datos (data mining), han tomado más protagonismo en los últimos meses, hay más personas que indagan sobre estas dos tecnologías y la Web aumenta en definiciones y conceptos.  Si nos tuviéramos que quedar con una definición de minería de datos, optaríamos por la que dice lo siguiente: “Proceso para extraer conocimiento útil y comprensible, previamente desconocido, desde grandes cantidades de datos, almacenados en distintos formatos”.

Minería de datos = Extraer conocimiento de grandes cantidades de datos

Implementar ¿si?, ¿no?,… me lo estoy pensando…

La pregunta que algunos se estarán formulando es si deberían contemplar el desarrollo de un proyecto de minería de datos en su empresa.  Los beneficios que se describen son muy interesantes y atractivos, pero como en toda tecnología, si existen beneficios para implementarla, también habrá inconvenientes y costes.  Al final, se trata de identificar si la suma de beneficios será superior al total de costes.

¿Implementar? = Necesidades del negocio + Beneficios Esperados – Coste personal – Coste materiales

¿Por donde comenzamos?

Un buen inicio para evaluar la utilidad de contar con una solución de minería de datos es identificando la serie de necesidades del negocio que podrían ser cubiertas.  Viene bien recordar una expresión relacionada a este asunto: “la necesidad debe crear el programa y no el programa debe crear la necesidad”.  Ejemplos de necesidades de negocio:

  • Identificar razones de subidas de consumo
  • Señalar motivos bajadas de las ventas
  • Adecuar producción a ventas futuras
  • Determinar tendencias del mercado
  • Evaluar tendencias de comportamiento de la competencia
  • Reducir listas de espera

Objetivos del negocio vs. Objetivos de la aplicación

La identificación de las necesidades del negocio permitirá identificar los objetivos del negocio, las que no necesariamente serán las funciones de la aplicación a implementar.  Por ejemplo, identificar las probabilidades de compra de un segmento de cliente bajo ciertas variables, es una tarea de la aplicación de minería de datos a desarrollar.  Lograr una respuesta del 10% en un determinado segmento corresponde a un objetivo de negocio, que se logrará, según las acciones que se tomen y quizás la información que brinde la aplicación sea determinante.

Minería de datos dirigida y no dirigida

Tener los objetivos de negocio presente en el desarrollo del proyecto, permitirá desglosarlo e identificar las tareas de minería de datos necesarias para contribuir a su logro.  Saber a priori lo que se va a realizar y que modelos se van obtener se denomina minería de datos dirigida (model-driven).

El modelo no dirigido, partiendo sólo de los datos (data-driven) consiste en obtener patrones, que a medida que se van “descubriendo” se estime si pueden ser útiles para resolver algunas necesidades del negocio.  Este método es más abierto y arriesgado, porque en muchos casos, algunos modelos encontrados serán descartados porque no solventarán ninguna necesidad del negocio.

Para una fase inicial de un proyecto de minería de datos, se recomienda el modelo dirigido, en una fase posterior, cuando se cuente con una mayor maduración tanto de la aplicación implementada como del equipo de colaboradores a cargo, se podría probar el modelo no dirigido.

Resumiendo, la sugerencia para evaluar la posibilidad de poner en marcha un proyecto de minería de datos sería: Identificar necesidades, sopesar beneficios vs. costos, señalar objetivos del negocio y determinar las tareas de la minería de datos que se desarrollarían (model – driven).

aníbal goicochea

Anuncios