La Minería de Datos (DM) por las siglas en inglés Data Mining es el proceso de extraer conocimiento útil y comprensible, previamente desconocido, desde grandes cantidades de datos almacenados en distintos formatos. Las herramientas de Data Mining predicen futuras tendencias y comportamientos, permitiendo en los negocios la toma de decisiones.

La principal diferencia entre la Minería de Datos y las Estadísticas Tradicionales es que la primera consiste en trabajar con los datos de observación, mientras que el segundo comprende datos experimentales controlados.

El Data Mining utiliza el análisis matemático para deducir los patrones y tendencias que existen en los datos. Normalmente, estos patrones no se pueden detectar mediante la exploración tradicional de los datos porque las relaciones son demasiado complejas o porque hay demasiado datos.

Estos patrones y tendencias se pueden recopilar y definir como un modelo de minería de datos. Los modelos de minería de datos se pueden aplicar en escenarios como los siguientes:

  • Pronóstico: cálculo de las ventas y predicción de las cargas de trabajo
  • Riesgo y probabilidad: elección de los mejores clientes para la distribución de determinados productos, determinación del punto de equilibrio probable para los escenarios de riesgo, y asignación de probabilidades a diagnósticos y otros resultados
  • Recomendaciones: determinación de los productos que se pueden vender juntos y generación de recomendaciones
  • Búsqueda de secuencias: análisis de los artículos que los clientes han introducido en el carrito de la compra y predicción de posibles eventos
  • Agrupación: distribución de clientes o eventos en grupos de elementos relacionados, y análisis y predicción de afinidades

Lo habitual es que la MD se mueva en el contexto amplio del Descubrimiento de Conocimiento en bases de datos, a caballo entre diferentes disciplinas con principios de Estadística, Aprendizaje en Máquinas, Inteligencia Artificial, Reconocimiento de Patrones y tecnología de Bases de Datos.
Las principales tareas dentro de la Minería de Datos son:

  1. Visualización y Exploración de Datos (EDA)
  2. Modelo Descriptivo
  3. Modelo Predictivo
  4. Descubrimiento de Patrones y Reglas
  5. Recuperación por contenido

Los componentes del algoritmo de la MD son:

  1. Estructura del Modelo o Patrón: local y global
  2. Función de Puntuación: basada en predicción o en criterios
  3. Método de Optimización y búsqueda
  4. Estrategia de Gestión de Datos

Un ejemplo de la aplicación práctica de la Minería de Datos sería la de clasificar a los estudiantes de una Universidad de acuerdo a su rendimiento académico, para posteriormente encontrar patrones ocultos y reglas que los caractericen; basado en las relaciones que se establecen entre el centro de procedencia de los estudiantes, nivel de escolaridad de los padres y provincia de origen con sus resultados académicos en el primer curso en la universidad. Estos resultados pueden mejorar el proceso de formación académica y elevar la calidad de la educación en la Universidad.

Otra de las aplicaciones prácticas más habituales es analizar el comportamiento de compra de los clientes de las grandes superficies para colocar ciertos productos en la misma zona, provocando una mayor compra por impulso y asociación.

Data Mining

La generación de un modelo de minería de datos forma parte de un proceso más complejo que incluye desde la formulación de preguntas acerca de los datos y la creación de un modelo para responderlas, hasta la implementación del modelo en un entorno de trabajo.

Este proceso se puede definir mediante los seis pasos básicos siguientes:

  1. Definir el problema
  2. Preparar los datos
  3. Explorar los datos
  4. Generar modelos
  5. Explorar y validar los modelos
  6. Implementar y actualizar los modelos

Si ya tienes un buen nivel sobre Data Mining, estos libros te puede ayudar a ir un poco más lejos. No están recomendados para ejecutivos ni para principiantes.

Compartir ...
Si te ha gustado, déjanos tu opinión en el área de comentarios y compártelo en las redes sociales.