Orange: primeros pasos en Data Mining

, Data Mining

Orange es una de las herramientas más punteras de Data Mining, desarrollado por el Laboratorio de Bioinformática de la Facultad de Informática y Ciencias de la Información de la Universidad de Ljubljana, Eslovenia.

Este software, de libre aprendizaje, permite explorar datos y obtener resultados de forma inmediata. Además, se ha extendido en el sector de la medicina y la ciencia, así como en la enseñanza. Pero permite desarrollar sus funcionalidades en cualquier campo.

Con Orange podemos crear flujos de trabajo interactivos y analizar los datos de una base con mayor profundidad. Se trata de disponer de la información en formatos comprensibles y útiles para la empresa, como gráficos, árboles o redes.

Iniciarse en Orange Data Mining

Para empezar a manejar Orange, arrancamos con una base de datos simple escrita en la hoja de cálculos que ofrece Google Drive. En el ejemplo del vídeo, nos muestra una hoja con las características fisiológicas de personas, color de ojos, tipo de pelo, altura…etc. Pero podemos utilizar en nuestra base de datos otra información con un carácter más empresarial. Por ejemplo, en el caso de nuestros clientes de un ecommerce de ropa la localidad, la edad, textil preferente (faldas, suéter, pantalón, complementos…), colección (colección de verano, colección de color negro rock, etc). Una vez tenemos nuestro excel completado, es tan sencillo como obtener el link del documento, podemos hacerlo con la opción “Compartir”

A partir de aquí cargamos nuestra base de datos en Orange y comenzamos a trabajar.

Predicción del futuro

Los datos nos ayudarán a predecir el futuro, al menos el comportamiento del cliente. Orange nos permite incluir decenas de variables sobre un mismo cliente, servicio o producto, para examinar cómo se comportará. En el vídeo nos muestra el ejemplo de frutas, donde incluye, entre otros, sus valores nutricionales. Si lo hacemos con nuestro ejemplo, Orange nos permitirá conocer cuál es la característica que prevalece sobre el resto, supongamos que es la compra de textiles de pantalón de la colección de verano.

A partir de aquí, podemos establecer varias posibles predicciones cruzarlas entre ellas y detectar cual es la que más éxito obtiene. Estos datos nos pueden ayudar a establecer una gama de productos nuevos derivados de los que mayor éxito y aceptación tienen entre nuestros clientes.

A pesar de todo, Orange está indicado para datos muy concretos y con un carácter científico. Pero siempre se puede readaptar a la empresa y a sus necesidades.

Comments

comments