En el escenario en línea de toma de decisiones, un jugador tiene que escoger entre un conjunto de decisiones disponibles y, tras ello, incurre en una pérdida correspondiente a la calidad de la opción elegida. El paradigma de la minimización de arrepentimiento (regret minimization) sugiere la meta de causar una pérdida promedio que se acerque a la mejor decisión fijada a posteriori. Recientemente las herramientas de la optimización convexa han dado lugar a algoritmos que son más generales, unifican resultados previos y con frecuencia brindan límites de arrepentimiento nuevos y mejorados.
En este documento se estudian algunos de los desarrollos recientes en esta fusión entre la optimización y el aprendizaje. Se comienza describiendo dos plantillas generales para producir algoritmos y validar límites de arrepentimiento. Las plantillas son muy simples y unifican el análisis de varios algoritmos bien conocidos y utilizados.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Un marco de optimización en tiempo real para el problema de ajuste del controlador iterativo
Video:
Algoritmos genéticos probabilísticos constructores de modelos
Artículo:
Modelo de producción-inventario con tiempo de espera proporcional al tiempo de producción
Video:
Lec. 45. Modelo EOQ con descuentos
Artículo:
El impacto de los parámetros del proceso de fundición a presión sobre las propiedades mecánicas y sus defectos de la aleación de aluminio A413.
Artículo:
Creación de empresas y estrategia : reflexiones desde el enfoque de recursos
Artículo:
La gestión de las relaciones con los clientes como característica de la alta rentabilidad empresarial
Artículo:
Los web services como herramienta generadora de valor en las organizaciones
Artículo:
Configuración de los valores de María, antes y después de la violación, en Satanás de Mario Mendoza