Técnicas de aplicación de Data Mining

, Data Mining

El Data Mining o minería de datos permite integrarse en el business intelligence y mostrar estadísticas y patrones de conducta que será útiles para analizar nuestro target y realizar estrategias de marketing y captación de clientes.

Para poner en marcha la minería de datos, que se centran en cientos de algoritmos, existen distintas técnicas, aquí os explicamos cuales son las más destacadas.

Redes neuronales artificiales

Los métodos de Data Mining  basados en redes neuronales se aplican para reconocer patrones de comportamiento a partir de los datos y poder clasificaros, aunque es una de las técnicas menos utilizadas dado que son de difícil comprensión. Son modelos predictivos no lineales, que recuerdan a una red de neuronas del sistema nervioso. La finalidad de las redes neuronales es construir un modelo que sea capaz de reproducir el método de aprendizaje del cerebro humano. Entre las empresas que han llevado a cabo el modelo de red neuronal artificial se encuentra Google, en su caso fue útil para reconocer los números de las calles en las imágenes que iban tomando con sus coches, consiguiendo un 96% de precisión en sus resultados. Por otro lado, se han aplicado en el control meteorológico, medición de audiencias de televisión, previsión de impacto en RRSS o en la predicción en los mercados financieros…

DATA MINING 2

Árboles de decisión

Esta metodología de Data Mining se centra en un conjunto de decisiones, que generan reglas que sirven para clasificar un conjunto de datos, como si se tratara de una estructura de un árbol, es decir, sobre los datos se realizan sucesivas bifurcaciones hasta llegar a un resultado. Entre sus aplicaciones podemos destacar el  juego web “Akinator el genio adivino”, que consiste en pensar en un personaje y el sistema va haciendo una serie de preguntas, tipo “Quien es quien” con respuestas de “sí” o “no”.  Con cada pregunta, va descartando opciones hasta que se aproxima al personaje correcto. Tiene una menor capacidad predictiva si los comparamos con las redes neuronales, debido a su sistema de preguntas.

Reglas de inducción

Las reglas permiten expresar disyunciones de manera más fácil que los árboles en Data Mining y tienden a preferirse con respecto a los árboles por tender a representar “pedazos” de conocimiento relativamente independientes. Además, permiten generar y contrastar patrones a partir de los datos de entrada en el sistema. En este caso, se utilizan datos de entrada que constituyen un conjunto de casos clasificados asociados a un conjunto de variables definidas. Por tanto, se basan en cálculos estadísticos que siguen un patrón clásico de “si-entonces”, es decir, como los clásicos juegos de rol, dependiendo el camino que elijas encontrarás una u otras aventura ante tí. Básicamente, sirven para extraer conclusiones y hacer pronósticos.

Algoritmos genéticos

Este es uno de los métodos más utilizados en el Data Mining, que se centra en aplicar técnicas de optimización basadas en los conceptos de la combinación genética, la mutación y la selección natural. Los algoritmos genéticos están relacionados con las redes neuronales, ya que ésta técnica también tiene su base en la biología. Los algoritmos genéticos aplican los mecanismos de la genética y de la selección natural para buscar conjuntos óptimos de parámetros que describan una función de predicción. Esta técnica utiliza un proceso muy iterativo de selección, cruzado y de mutación de operadores, evolucionando las sucesivas generaciones de modelos. En cada iteración, cada modelo compite con todos los otros modelos por la herencia de los rasgos de los anteriores hasta que sólo el modelo más predictivo sobrevive.

 

Comments

comments