Endesa, líder en el sector eléctrico en España, aplicó herramientas de Data Mining en su Smart Grid para detectar el fraude.
De hecho, identificó un aumento del fraude del 76% en Córdoba entre el 2014 y 2015, aunque la cifra ha aumentado en 2016 dado que la empresa ha intensificado el trabajo de identificación de fraude.
Las herramientas de Data Mining están diseñadas para realizar análisis de grandes volúmenes de datos y tienen capacidad para integrar bases de datos de disitntas fuentes. Esto facilitó la tarea a Endesa a la hora de detectar el fraude. Fueron capaces de cruzar datos de consumo eléctricos, zonas y el propietario del inmueble. Los datos detectaron casi 83.522 casos de fraude en 2015, casi un 25% más que en 2014.
Además, pudo identificar los culpables del fraude, donde un 80% eran PYMEs y empresas de diversos sectores industriales, mientras que el 20% correspondía a particulares con grandes consumos en la capital cordobesa.
Herramientas de Data Mining
KNIME: Capacidad de pre-procesamiento de datos con tres componentes principales: la extracción, la transformación y la carga de datos. Dispone de una interfaz gráfica que permite el montaje de nodos de procesamiento de datos. Se trata de una plataforma de análisis de datos de origen, con la posibilidad de presentar informes e integración abierta. KNIME también integra diversos componentes para el aprendizaje automático y minería de datos a través de su concepto de segmentación de datos modular, características que han llamado la atención del Business Intelligence y el análisis de datos financieros.
Por otro lado, destacar que esta herramienta está escrita en Java y basado en Eclipse. KNIME tiene la facilidad de añadir plugins y funcionalidades adicionales en cualquier momento.
WEKA: La versión original de esta herramienta se destina al análisis de datos del sector agrícola. Pero fue evolucionando y desarrollo una herramienta superior basada en Java. Esta versión permite analizar datos y establecer modelos predictivos.
Igual que RapidMiner, Weka realiza trabajos de data mining estándar, incluyendo pre-procesamiento de datos, clustering, clasificación, regresión, visualización y selección de características.
Comments
comments