Biblioteca122.739 documentos en línea

Artículo

Algoritmo híbrido basado en aprendizaje computacional para el manejo de datos faltantes en aplicaciones OLAPHybrid algorithm based machine learning for missing data management applications OLAP

Resumen

El artículo presenta el desarrollo y uso de un algoritmo híbrido de aprendizaje computacional para la tarea de relleno de valores faltantes realizada durante la fase de preparación de datos. En primer lugar, se aborda el problema a resolver, el que está orientado al estudio y análisis de diferentes técnicas para el relleno de valores faltantes, con el fin de proponer una técnica híbrida como producto de esta investigación para dicha tarea y asociarla con la tecnología OLAP (Procesamiento Analítico en Línea). Luego, se justifica la metodología de investigación (científica descriptiva-exploratoria con enfoque experimental) aplicada en este proyecto. Se realizó la revisión de técnicas utilizadas en el relleno de valores faltantes; con base en la verificación de las técnicas y los casos de estudio, se seleccionaron métodos basados en vecindad y redes neuronales artificiales, y se propuso una técnica híbrida (KMediasSom) aplicada a un conjunto de datos sintético y a uno real, provenientes de una aplicación OLAP. En seguida, se plantean las pruebas de análisis y resultados con el fin de precisar su aplicabilidad en cuanto a efectividad y complejidad algorítmica se refiere. Finalmente, se presentan las conclusiones, donde se demostró que la técnica híbrida genera mejores resultados que las técnicas usadas por separado.

INTRODUCCIÓN

El volumen de datos que manejan las organizaciones cada vez es más grande, no sólo porque sus sistemas guardan transacciones más detalladas sino porque actualmente la información histórica también está siendo utilizada como soporte en la toma de decisiones. Para realizar tareas de proyección, las empresas se están valiendo, cada día con mayor frecuencia, de tecnologías de análisis de datos como OLAP o minería de datos. Dentro del tratamiento de datos lo que se denomina limpieza de datos, agrupa tareas como el relleno de valores faltantes que tiene como uno de sus propósitos ayudar en el mejoramiento de la calidad de los datos. Existen diversas técnicas utilizadas para el relleno de valores faltantes, las que se usan dependiendo de algunos factores como la naturaleza de los datos. Asimismo, al verificarse el funcionamiento de las técnicas podría existir la posibilidad de generar una técnica híbrida que produjera mejoras a alguna de ellas y que al realizar la evaluación de indicadores se pudiera establecer la pertinencia de su aplicabilidad, la viabilidad de su implementación y la opción de adaptarla a aplicaciones de tecnología OLAP.

Con este artículo se plantea una técnica híbrida con base en la comparación de técnicas de aprendizaje computacional que suelen ser utilizadas en el relleno de valores faltantes y que puedan enfocarse a aplicaciones OLAP.

  • Tipo de documento:Artículo
  • Formato:pdf
  • Idioma:Español
  • Tamaño:428 Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento