CRISP-DM, Una metodología para proyectos de Minería de Datos


Para implementar una tecnología en un negocio, se requiere de una metodología.  La mayoría de las consultoras especializadas en alguna tecnología cuentan, con por lo menos, una metodología, según los tipos de proyectos que aborden.  Estos métodos son definidos a partir de sus experiencias y tomando lo mejor de los procedimientos más exitosos o populares.  Contar con una metodología, se ha convertido tan importante y necesario como la carta de presentación de las empresas.

Para los diferentes tipos de tecnologías, hay varias metodologías, algunas están publicadas en Internet.  Para el caso de proyectos de implementación de minería de datos, hay una en particular; CRISP-DM, en sus primeros años de divulgación tenía apoyos de empresas privadas y organismos públicos, pero poco a poco ha ido perdiendo uno que otro “Project Partner”.  Desconocemos el motivo de esta aparente perdida de apoyo, pero estamos seguros que no corresponde a la falta de calidad o efectividad del método, porque ha sido adoptado por otros organismos y empresas.

 Metodologia para Mineria de Datos - CRISP-DM

El estándar incluye un modelo y una guía, estructurados en seis fases, algunas de estas fases son bidireccionales, lo que significa que algunas fases permitirán revisar parcial o totalmente las fases anteriores.

Comprensión del negocio (Objetivos y requerimientos desde una perspectiva no técnica)

  • Establecimiento de los objetivos del negocio (Contexto inicial, objetivos, criterios de éxito)
  • Evaluación de la situación (Inventario de recursos, requerimientos, supuestos, terminologías propias del negocio,…)
  • Establecimiento de los objetivos de la minería de datos (objetivos y criterios de éxito)
  • Generación del plan del proyecto (plan, herramientas, equipo y técnicas)

Comprensión de los datos (Familiarizarse con los datos teniendo presente los objetivos del negocio)

  • Recopilación inicial de datos
  • Descripción de los datos
  • Exploración de los datos
  • Verificación de calidad de datos

Preparación de los datos (Obtener la vista minable o dataset)

  • Selección de los datos
  • Limpieza de datos
  • Construcción de datos
  • Integración de datos
  • Formateo de datos

Modelado (Aplicar las técnicas de minería de datos a los dataset)

  • Selección de la técnica de modelado
  • Diseño de la evaluación
  • Construcción del modelo
  • Evaluación del modelo

Evaluación (De los modelos de la fase anteriores para determinar si son útiles a las necesidades del negocio)

  • Evaluación de resultados
  • Revisar el proceso
  • Establecimiento de los siguientes pasos o acciones

Despliegue (Explotar utilidad de los modelos, integrándolos en las tareas de toma de decisiones de la organización)

  • Planificación de despliegue
  • Planificación de la monitorización y del mantenimiento
  • Generación de informe final
  • Revisión del proyecto

 

Esta metodología para proyectos de minería de datos no es la “más actual” o “la mejor”, pero es muy útil para comprender esta tecnología o extraer ideas para diseñar o revisar métodos de trabajo para proyectos de similares características.

aníbal goicochea

Anuncios

8 Respuestas a “CRISP-DM, Una metodología para proyectos de Minería de Datos

  1. disculpa, no existen otras metodologías diferentes a la que mencionas?

    Me gusta

    • Hola Felipe,

      Perdona la demora,… no conozco otra metodología de minería de datos, pero al final se trata de tomar lo mejor de las dos más conocidas y por la propia experiencia y conocimiento que irás adquiriendo, establecer unos lineamientos para lograr los objetivos que definas en cada proceso de aprendizaje, que el cualquier caso, debería ser ascendente en eficiencia y calidad de resultados.

      Gracias. Saludos

      Me gusta

  2. Juan Carlos González

    Aníbal, excelente resumen. Me pregunto si la imagen es suya o cuál es la fuente, pues deseo incluirla en un trabajo que estoy realizando.

    Gracias

    Me gusta

  3. Pingback: Metodología para desarrollo de Proyectos de Minería de Datos « Algoritmos TDIDT aplicado al Analisis de suelo

  4. Excelente artículo de verdad, estoy realizando una tesis sobre minería de datos aplicada a la deserción escolar y necesitaba información sobre las metodologías!

    Agradecido.

    Me gusta

  5. Esta metodología se basa el software spss, ahí pueden encontrar mayor documentación para aplicar esta metodología

    Me gusta

  6. Hola Anibal me parece muy interesante el resumen que haz hecho sobre la metodolgia CRISP-DM. Yo estoy investigando tambien en esa temática y coincido contigo en la necesidad de retomar esta metodología para la toma de decisión en los negocios.

    Me gusta

Deja un comentario... Gracias!!!

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s