El Descubrimiento de Conocimiento en Bases de Datos (KDD) es un proceso compuesto por varias etapas, que comienza con la recolección de datos para el problema en cuestión y termina con la interpretación y evaluación de los resultados obtenidos. El presente trabajo pretende mostrar la influencia del análisis exploratorio de datos en el rendimiento de las técnicas de Minería de Datos en cuanto a la clasificación de nuevos patrones a través de su aplicación a un problema médico, además de comparar su rendimiento entre sí, con el objetivo de obtener la técnica con mayor porcentaje de aciertos. A partir de los resultados obtenidos, se puede concluir que este análisis, si se realiza adecuadamente, puede aportar importantes mejoras en el rendimiento de casi todas las técnicas abordadas, convirtiéndose así en una importante herramienta para optimizar los resultados finales. Para el problema en estudio, la técnica que involucra un modelo de Programación Lineal y otra que involucra Redes Neuronales fueron las técnicas que presentaron el menor porcentaje de errores para los conjuntos de prueba, presentando capacidades de generalización satisfactorias.
1. INTRODUCCIÓN
Abordar las técnicas y herramientas que buscan transformar los datos almacenados, ya sean de industrias, bancos, hospitales, telecomunicaciones, ecológicos, inmobiliarios y otros, en conocimiento es el objetivo del área denominada Descubrimiento de Conocimiento en Bases de Datos (KDD).
El proceso de KDD es un conjunto de actividades continuas que comparten el conocimiento descubierto a partir de bases de datos. Según Fayyad et al. (1996), este conjunto se compone de cinco pasos: selección de datos; preprocesamiento y limpieza de datos; transformación de datos; minería de datos; e interpretación y evaluación de los resultados. La interacción entre estas distintas etapas puede verse en la Figura 1, donde las tres primeras pueden interpretarse como el análisis exploratorio de datos.
El proceso KDD se refiere a cualquier proceso de descubrimiento de conocimiento útil en los datos, mientras que la Minería de Datos se refiere a la aplicación de algoritmos para extraer modelos de los datos; hasta 1995, muchos autores consideraban los términos KDD y Minería de Datos como sinónimos. Según Freitas (2000), el conocimiento a descubrir debe cumplir tres propiedades: debe ser correcto (en la medida de lo posible); debe ser comprensible por los usuarios humanos; y debe ser interesante/útil/nuevo. Asimismo, el método de descubrimiento de conocimientos debe presentar las tres características siguientes: debe ser eficaz (preciso), genérico (aplicable a varios tipos de datos) y flexible (fácilmente modificable).
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Los procesos evolutivos de las poblaciones de empresas y trabajadores
Artículo:
Caminos hacia la sostenibilidad en las organizaciones: evidencia empírica sobre el papel de las prácticas verdes de gestión de recursos humanos y el capital intelectual verde
Artículo:
Los primeros pasos en la redacción de artículos científicos en ingeniería
Artículo:
Aplicaciones de la tecnología láser en el ejército
Artículo:
Los observadores de clase y su posición en el campo de la enseñanza del inglés
Artículo:
Creación de empresas y estrategia : reflexiones desde el enfoque de recursos
Artículo:
Los web services como herramienta generadora de valor en las organizaciones
Artículo:
La gestión de las relaciones con los clientes como característica de la alta rentabilidad empresarial
Libro:
Ergonomía en los sistemas de trabajo