Biblioteca122.739 documentos en línea

Artículo

Estudio de un problema médico utilizando KDD, con énfasis en el análisis exploratorio de datosStudy of a medical problem using KDD, with emphasis on exploratory data analysis

Resumen

El Descubrimiento de Conocimiento en Bases de Datos (KDD) es un proceso compuesto por varias etapas, que comienza con la recolección de datos para el problema en cuestión y termina con la interpretación y evaluación de los resultados obtenidos. El presente trabajo pretende mostrar la influencia del análisis exploratorio de datos en el rendimiento de las técnicas de Minería de Datos en cuanto a la clasificación de nuevos patrones a través de su aplicación a un problema médico, además de comparar su rendimiento entre sí, con el objetivo de obtener la técnica con mayor porcentaje de aciertos. A partir de los resultados obtenidos, se puede concluir que este análisis, si se realiza adecuadamente, puede aportar importantes mejoras en el rendimiento de casi todas las técnicas abordadas, convirtiéndose así en una importante herramienta para optimizar los resultados finales. Para el problema en estudio, la técnica que involucra un modelo de Programación Lineal y otra que involucra Redes Neuronales fueron las técnicas que presentaron el menor porcentaje de errores para los conjuntos de prueba, presentando capacidades de generalización satisfactorias.

1. INTRODUCCIÓN

Abordar las técnicas y herramientas que buscan transformar los datos almacenados, ya sean de industrias, bancos, hospitales, telecomunicaciones, ecológicos, inmobiliarios y otros, en conocimiento es el objetivo del área denominada Descubrimiento de Conocimiento en Bases de Datos (KDD).

El proceso de KDD es un conjunto de actividades continuas que comparten el conocimiento descubierto a partir de bases de datos. Según Fayyad et al. (1996), este conjunto se compone de cinco pasos: selección de datos; preprocesamiento y limpieza de datos; transformación de datos; minería de datos; e interpretación y evaluación de los resultados. La interacción entre estas distintas etapas puede verse en la Figura 1, donde las tres primeras pueden interpretarse como el análisis exploratorio de datos.

El proceso KDD se refiere a cualquier proceso de descubrimiento de conocimiento útil en los datos, mientras que la Minería de Datos se refiere a la aplicación de algoritmos para extraer modelos de los datos; hasta 1995, muchos autores consideraban los términos KDD y Minería de Datos como sinónimos. Según Freitas (2000), el conocimiento a descubrir debe cumplir tres propiedades: debe ser correcto (en la medida de lo posible); debe ser comprensible por los usuarios humanos; y debe ser interesante/útil/nuevo. Asimismo, el método de descubrimiento de conocimientos debe presentar las tres características siguientes: debe ser eficaz (preciso), genérico (aplicable a varios tipos de datos) y flexible (fácilmente modificable).

  • Tipo de documento:Artículo
  • Formato:pdf
  • Idioma:Portugues
  • Tamaño:587 Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento

  • Titulo:Estudio de un problema médico utilizando KDD, con énfasis en el análisis exploratorio de datos
  • Autor:Arns Steiner, Maria Teresinha; Soma, Nei Yoshihiro; Shimizu, Tamio; Nievola, Júlio Cesar; Steiner Neto, Pedro José
  • Tipo:Artículo
  • Año:2006
  • Idioma:Portugues
  • Editor:UFSCar Universidade Federal de Sao Carlos
  • Materias:Análisis de datos Ciencia de datos Minería de datos
  • Descarga:0