Biblioteca122.294 documentos en línea

Artículo

AdaCN: An Adaptive Cubic Newton Method for Nonconvex Stochastic OptimizationAdaCN: un método Newton cúbico adaptativo para la optimización estocástica no convexa

Resumen

En este trabajo, introducimos AdaCN, un nuevo método Newton cúbico adaptativo para la optimización estocástica no convexa. AdaCN captura dinámicamente la curvatura del paisaje de pérdidas mediante la aproximación diagonal del hessiano más la norma de diferencia entre las dos estimaciones anteriores. Sólo requiere como máximo gradientes de primer orden y actualizaciones con una complejidad lineal tanto en tiempo como en memoria. Para reducir la varianza introducida por la naturaleza estocástica del problema, AdaCN contrata el primer y segundo momento para implementar y la media móvil exponencial sobre los gradientes estocásticos actualizados iterativamente y los hessianos estocásticos aproximados, respectivamente. Validamos AdaCN en amplios experimentos, mostrando que supera a otros métodos estocásticos de primer orden (incluyendo SGD, Adam y AdaBound) y al método estocástico de cuasi-Newton (es decir, Apollo), tanto en términos de velocidad de convergencia como de rendimiento de generalización.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento