Biblioteca122.739 documentos en línea

Artículo

CMIN - herramienta case basada en CRISP-DM para el soporte de proyectos de minería de datosCMIN a CRISP-DM-based case tool for supporting data mining projects

Resumen

En este artículo se presenta la CMIN, una herramienta CASE (Computer Aided Software Engineering) integrada (que soporta todas las fases de un proceso) basada en CRISP-DM 1.0 (Cross - Industry Standard Process for Data Mining) para soportar el desarrollo de proyectos de minería de datos. Primero se expone la funcionalidad general de CMIN, lo que incluye la gestión de procesos, plantillas y proyectos, y se destaca la capacidad de CMIN para realizar el seguimiento de los proyectos de una forma fácil e intuitiva y la manera como CMIN posibilita que el usuario incremente su conocimiento en el uso de CRISP-DM o de cualquier otro proceso que se defina en la herramienta a través de las ayudas e información que se ofrece en cada paso del proceso. Después, se detalla cómo CMIN permite enlazar en tiempo de ejecución (sin necesidad de volver a compilar la herramienta) nuevos algoritmos de minería de datos que apoyen la labor de modelado (basada en un flujo de trabajo o workflow) en un proyecto de minería de datos. Finalmente, se ofrecen los resultados de dos evaluaciones de la herramienta, las conclusiones y el trabajo futuro.

Introducción

En ingeniería de software se han establecido diversos procesos, metodologías y herramientas para estandarizar y facilitar el desarrollo de sus productos. Entre las herramientas se cuentan las CASE, las cuales soportan en forma automática varios o todos los pasos de dichas metodologías y se enmarcan en la ingeniería del software asistida por computador o Computer Aided  Software  Engineering  (INEI,  1999). Las herramientas CASE ayudan a reducir el tiempo empleado en el desarrollo de un sistema, lo que mantiene el costo estable y contribuye a mejorar su calidad (Miren  Begoña,  2000).  Además,  permiten al analista documentar y modelar un sistema, desde la definición de requerimientos hasta el diseño, implementación y prueba (Miren Begoña, 2000).

Hoy se encuentran diversas herramientas software para apoyar el desarrollo de proyectos de minería de datos (Britos et al., 2005; Kdnuggets, 2005; MetaGroup, 2004). Basado en el listado de herramientas que aparecen en MetaGroup (2004) y Kdnuggest (2005), se realizó una valoración de las más representativas, entre ellas: Clementine (Khabaza & Shearer, 1995; SPSS-Inc., 2009), Insightful  Miner (Insightful-Corporation), WEKA (Holmes, Donkin  &  Witten, 1994; University-of-Waikato, 2009), CART (Salford-System, 2009), PolyAnalyst (Mai,  Krishna  &  Reddy,  2005;  Megaputer,  2009;  Rippa  & Lendyuk, 2007) y SAS Enterprise Miner (SAS, 2009a). Los criterios generales para dicha valoración fueron: el acceso (costo de las herramientas), la interfaz de usuario (facilidad o dificultad que puede  llegar a tener el uso de la herramienta por parte de los usuarios), el proceso (o metodología) en la que se basan, la extensibilidad (capacidad de ampliar fácil y dinámicamente el conjunto de algoritmos que ofrece la herramienta) y el soporte al desarrollo del  proyecto  por  parte de equipos de trabajo.

  • Tipo de documento:Artículo
  • Formato:pdf
  • Idioma:Español
  • Tamaño:1010 Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento

  • Titulo:CMIN - herramienta case basada en CRISP-DM para el soporte de proyectos de minería de datos
  • Autor:Cobos, Carlos; Zuñiga, Jhon; Guarin, Juan; León, Elizabeth; Mendoza, Martha
  • Tipo:Artículo
  • Año:2010
  • Idioma:Español
  • Editor:Universidad Nacional de Colombia. Facultad de Ingeniería.
  • Materias:Minería de datos Ingeniería de software
  • Descarga:7