En el reconocimiento de acciones de vdeo basado en el aprendizaje profundo, el diseo de la red neuronal se centra en cmo adquirir informacin espacial efectiva e informacin de movimiento rpidamente. Este artculo propone un tipo de red profunda que puede obtener tanto informacin espacial como informacin de movimiento en la clasificacin de vdeo. Se denomina MDFs (the multidimensional motion features of deep feature map net). Este mtodo se puede utilizar para obtener informacin espacial e informacin de movimiento en vdeos slo importando datos de fotogramas de imagen en una red neuronal. Las MDF tienen su origen en la definicin de la convolucin 3D. Se utilizan mltiples ncleos de convolucin 3D con diferentes focos de informacin para actuar sobre los mapas de caractersticas de profundidad con el fin de obtener informacin de movimiento efectiva tanto a nivel espacial como temporal. Por otra parte, dividimos la convolucin 3D en dimensin espacial y dimensin temporal, y el mapa de caractersticas de la red espacial ha reducido las dimensiones de los datos de imagen del fotograma original, lo que permite mitigar los recursos informticos de la red convolucional 3D agrupada multicanal. Para realizar la diferenciacin del peso regional de las caractersticas espaciales, se introduce una capa de agrupacin ponderada de caractersticas espaciales basada en la gua de informacin de movimiento espacio-temporal para realizar la atencin a la informacin de alto reconocimiento. Mediante LSTM multinivel, realizamos la fusin entre la adquisicin de informacin semntica global y las caractersticas de profundidad en distintos niveles, de modo que las capas totalmente conectadas con informacin de clasificacin rica puedan proporcionar un mecanismo de atencin al marco para la capa de informacin espacial. Las MDF slo necesitan actuar sobre imgenes RGB. Mediante experimentos en tres conjuntos de datos experimentales universales de reconocimiento de acciones, UCF10, UCF11 y HMDB51, se concluye que la red MDF puede alcanzar una precisin comparable a la de dos flujos (RGB y flujo ptico) que requiere la importacin tanto de datos de fotogramas como de datos de flujo ptico en tareas de clasificacin de vdeo.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Sobre algunos resultados de estabilidad global tipo suficiencia para sistemas dinámicos variables en el tiempo con parametrizaciones dependientes del estado.
Artículo:
Cadenas de suministro descentralizadas bajo una demanda aleatoria dependiente del precio: Equilibrios no cooperativos frente a coordinación con contratos de reparto de costes
Artículo:
Una nueva optimización híbrida de enjambre de partículas Nelder-Mead para la optimización de la coordinación de relés de sobreintensidad direccionales
Artículo:
Un Método de Punto Interior para Resolver Programas Semidefinidos Utilizando Planos de Corte y Centros Analíticos Ponderados
Artículo:
Algoritmo de punto próximo aproximado para problemas de inclusión monótona máxima