El crecimiento en tamaño y complejidad de las redes neuronales convolucionales (CNNs) está forzando la partición de una red en múltiples aceleradores durante el entrenamiento y la segmentación de los cálculos de retropropagación sobre estos aceleradores. La segmentación resulta en el uso de pesos obsoletos. Los enfoques existentes para el entrenamiento segmentado evitan o limitan el uso de pesos obsoletos con técnicas que subutilizan los aceleradores o aumentan la huella de memoria de entrenamiento. Este artículo aporta un esquema de retropropagación segmentado que utiliza pesos obsoletos para maximizar la utilización del acelerador y mantener la sobrecarga de memoria moderada. Explora el impacto de los pesos obsoletos en la eficiencia estadística y el rendimiento utilizando 4 CNNs (LeNet-5, AlexNet, VGG y ResNet) y muestra que cuando se introduce la segmentación en capas tempranas, el entrenamiento con pesos obsoletos converge y da como resultado modelos con precisión de inferencia comparable a la de aquellos
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Control heurístico difuso de un agitador electrodinámico en pruebas aceleradas de HALT / HASS
Artículo:
Identificación del estado de degradación de rodamientos basada en LPP optimizado por GA
Artículo:
Análisis del movimiento del conjunto de enchufe liberado
Artículo:
Análisis por elementos finitos de la deformación aplicada a la aleación de aluminio 6061-T6 mediante presión en canal angular de sección constante
Artículo:
Optimización mediante algoritmos genéticos de la forma de la voluta de un compresor centrífugo