El artículo presenta el desarrollo y uso de un algoritmo híbrido de aprendizaje computacional para la tarea de relleno de valores faltantes realizada durante la fase de preparación de datos. En primer lugar, se aborda el problema a resolver, el que está orientado al estudio y análisis de diferentes técnicas para el relleno de valores faltantes, con el fin de proponer una técnica híbrida como producto de esta investigación para dicha tarea y asociarla con la tecnología OLAP (Procesamiento Analítico en Línea). Luego, se justifica la metodología de investigación (científica descriptiva-exploratoria con enfoque experimental) aplicada en este proyecto. Se realizó la revisión de técnicas utilizadas en el relleno de valores faltantes; con base en la verificación de las técnicas y los casos de estudio, se seleccionaron métodos basados en vecindad y redes neuronales artificiales, y se propuso una técnica híbrida (KMediasSom) aplicada a un conjunto de datos sintético y a uno real, provenientes de una aplicación OLAP. En seguida, se plantean las pruebas de análisis y resultados con el fin de precisar su aplicabilidad en cuanto a efectividad y complejidad algorítmica se refiere. Finalmente, se presentan las conclusiones, donde se demostró que la técnica híbrida genera mejores resultados que las técnicas usadas por separado.
INTRODUCCIÓN
El volumen de datos que manejan las organizaciones cada vez es más grande, no sólo porque sus sistemas guardan transacciones más detalladas sino porque actualmente la información histórica también está siendo utilizada como soporte en la toma de decisiones. Para realizar tareas de proyección, las empresas se están valiendo, cada día con mayor frecuencia, de tecnologías de análisis de datos como OLAP o minería de datos. Dentro del tratamiento de datos lo que se denomina limpieza de datos, agrupa tareas como el relleno de valores faltantes que tiene como uno de sus propósitos ayudar en el mejoramiento de la calidad de los datos. Existen diversas técnicas utilizadas para el relleno de valores faltantes, las que se usan dependiendo de algunos factores como la naturaleza de los datos. Asimismo, al verificarse el funcionamiento de las técnicas podría existir la posibilidad de generar una técnica híbrida que produjera mejoras a alguna de ellas y que al realizar la evaluación de indicadores se pudiera establecer la pertinencia de su aplicabilidad, la viabilidad de su implementación y la opción de adaptarla a aplicaciones de tecnología OLAP.
Con este artículo se plantea una técnica híbrida con base en la comparación de técnicas de aprendizaje computacional que suelen ser utilizadas en el relleno de valores faltantes y que puedan enfocarse a aplicaciones OLAP.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
RUP: metodología en los sistemas y aplicaciones basadas en la web
Artículo:
Efecto de la concentración de SrAlO: Eu y Dy (SAO) en las características y propiedades de compuestos de luminiscencia de larga persistencia respetuosos con el medio ambiente a partir de ácido poliláctico y SAO
Artículo:
Solución heurística UTD para antenas cerca de una plataforma compleja
Artículo:
ESPRIT unitaria haz-doppler para la estimación de DOA multiobjetivo
Artículo:
Efectos del Tiempo de Recocido en el Rendimiento de OTFT en Vidrio con ZrO como Dieléctrico de Puerta
Libro:
Ergonomía en los sistemas de trabajo
Artículo:
Obtención de gas combustible mediante la bioconversión del alga marina Ulva lactuca
Artículo:
Sistemas de producción y potencial energético de la energía mareomotriz
Artículo:
La necesidad de la planeación estratégica en las organizaciones industriales modernas