Una nueva metodología para la predicción de series de tiempo usando regresión simbólica
A modification of the methodology of symbolic regression for time series prediction
En este artículo se propone una nueva metodología para la predicción de series de tiempo no lineales usando programación genética. La aproximación propuesta se basa en la incorporación del concepto de bloques funcionales y la modificación del algoritmo genético para que opere con estos. Los bloques funcionales representan modelos estadísticos bien conocidos para el pronóstico de series de tiempo. El algoritmo propuesto permite la exploración y explotación de regiones donde hay mayor posibilidad de encontrar mejores modelos de pronóstico. Para validar la aproximación propuesta, se pronosticaron dos series de tiempo Benchmark; se encontró que nuestra metodología pronostica con mayor precisión las series de tiempo consideradas en comparación con otros modelos no lineales.
1. INTRODUCCIÓN
Aunque la regresión simbólica (SR, por sus siglas del inglés) fue propuesta originalmente como una técnica para aproximar de forma empírica la relación no lineal, existente y desconocida entre un conjunto de variables de entrada y una de salida (Koza, 1992), recientemente ha sido aplicada con éxito al pronóstico de series de tiempo. Por ejemplo, Wang, Chau, Cheng y Qiu (2009) comparan la PG con varias técnicas de inteligencia artificial en el pronóstico de series de tiempo hidrológicas y concluyen que la PG podría superar dichas técnicas alternativas en términos de su precisión; Abdelmalek, Hamida y Abid (2009) usan la PG para obtener modelos de pronóstico de la volatilidad del índice S&P500.
La PG también ha sido usada en el desarrollo de modelos híbridos de pronóstico: Chen, Pang, Wang y Xu (2008) combinan la PG y un modelo de corrección de errores vectoriales; Lee y Tong (2011) usan un modelo ARIMA para extraer la componente lineal de la serie de tiempo estudiada, y luego la PG es utilizada para extraer la componente no lineal remanente de los residuales del modelo ARIMA. Adicionalmente, la PG también ha sido utilizada para determinar la estructura óptima de modelos de redes neuronales artificiales (Nikolaev e Iba, 2003; De Menezes y Nikolaev, 2006; Bernal-Urbina y Flores-Méndez, 2008). Finalmente, Wagner, Khouja, Michalewicz y McGregor (2007, 2008) desarrollan un nuevo modelo de PG para ambientes dinámicos.
Las razones de su éxito se derivan de la capacidad para encontrar relaciones no lineales ocultas en los datos, las cuales no podrían ser adecuadamente representadas por técnicas paramétricas convencionales, sin la necesidad de suponer, a priori, la forma matemática de la no linealidad; en su capacidad para descartar las variables irrelevantes durante la ejecución del algoritmo; y en la facilidad para controlar problemas comunes en las técnicas no paramétricas, como el data-snooping, el cual consiste en alcanzar resultados superiores, pero que son obtenidos únicamente por aleatoridad y que ocurre cuando un mismo conjunto de datos es usado más de una vez para inferencia o la selección del modelo final (Sullivan et al., 1999).
Recursos
-
Formatopdf
-
Idioma:español
-
Tamaño:554 kb