En este documento se propone un coprocesador de red neuronal convolucional basado en FPGA. El coprocesador tiene una unidad de cálculo convolucional 1D PE en modo de transmisión estacionaria de fila (RS) y una cadena de unidades de cálculo convolucional 3D PE en estructura de matriz pulsante. El coprocesador puede controlar de forma flexible el número de aperturas de la matriz PE según el número de canales de salida de la capa convolucional. En este documento, diseñamos un sistema de almacenamiento con caché multinivel, y la caché global utiliza múltiples difusiones para distribuir datos a las cachés locales y proponemos un método de segmentación de imágenes compatible con la arquitectura de hardware. El coprocesador propuesto implementa las capas convolucional y de agrupación del modelo de red neuronal VGG16, en el que el valor de activación, el valor del peso y el valor del sesgo se cuantifican utilizando cuantificación de punto fijo de 16 bits, con un rendimiento computacional máximo de 316
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Sobre la resolución del problema de deciclaje en una red de toro
Artículo:
Un Esquema de Descubrimiento de Grupo de Usuarios Orientado al Espacio de Temas en Redes Sociales: Una Perspectiva de Medición de Intereses Basada en Cadenas de Confianza
Artículo:
Recopilación en tiempo real de la distancia de entrenamiento de corredores de fondo basada en una red inalámbrica de sensores
Artículo:
Método de Identificación de Parámetros Estocásticos para Procesos de Simulación de Trayectorias de Conducción Basados en Computación en el Borde Móvil y Mapeo de Características Auto-organizadas.
Artículo:
Construyendo la Red Fonológica del Mandarín: Nuevo Inventario de Sílabas Utilizado para Identificar la Segmentación Esquemática