Biblioteca122.294 documentos en línea

Trabajo de curso

The convex optimization approach to regret minimizationEl enfoque de la optimización convexa aplicado a la minimización de arrepentimiento

Resumen

En el escenario en línea de toma de decisiones, un jugador tiene que escoger entre un conjunto de decisiones disponibles y, tras ello, incurre en una pérdida correspondiente a la calidad de la opción elegida. El paradigma de la minimización de arrepentimiento (regret minimization) sugiere la meta de causar una pérdida promedio que se acerque a la mejor decisión fijada a posteriori. Recientemente las herramientas de la optimización convexa han dado lugar a algoritmos que son más generales, unifican resultados previos y con frecuencia brindan límites de arrepentimiento nuevos y mejorados.

En este documento se estudian algunos de los desarrollos recientes en esta fusión entre la optimización y el aprendizaje. Se comienza describiendo dos plantillas generales para producir algoritmos y validar límites de arrepentimiento. Las plantillas son muy simples y unifican el análisis de varios algoritmos bien conocidos y utilizados.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño:290 Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento