Biblioteca122.294 documentos en línea

Artículo

The Multidimensional Motion Features of Spatial Depth Feature Maps: An Effective Motion Information Representation Method for Video-Based Action RecognitionLas características de movimiento multidimensional de los mapas de características de profundidad espacial: Un método eficaz de representación de la información de movimiento para el reconocimiento de acciones basado en vídeo

Resumen

En el reconocimiento de acciones de vdeo basado en el aprendizaje profundo, el diseo de la red neuronal se centra en cmo adquirir informacin espacial efectiva e informacin de movimiento rpidamente. Este artculo propone un tipo de red profunda que puede obtener tanto informacin espacial como informacin de movimiento en la clasificacin de vdeo. Se denomina MDFs (the multidimensional motion features of deep feature map net). Este mtodo se puede utilizar para obtener informacin espacial e informacin de movimiento en vdeos slo importando datos de fotogramas de imagen en una red neuronal. Las MDF tienen su origen en la definicin de la convolucin 3D. Se utilizan mltiples ncleos de convolucin 3D con diferentes focos de informacin para actuar sobre los mapas de caractersticas de profundidad con el fin de obtener informacin de movimiento efectiva tanto a nivel espacial como temporal. Por otra parte, dividimos la convolucin 3D en dimensin espacial y dimensin temporal, y el mapa de caractersticas de la red espacial ha reducido las dimensiones de los datos de imagen del fotograma original, lo que permite mitigar los recursos informticos de la red convolucional 3D agrupada multicanal. Para realizar la diferenciacin del peso regional de las caractersticas espaciales, se introduce una capa de agrupacin ponderada de caractersticas espaciales basada en la gua de informacin de movimiento espacio-temporal para realizar la atencin a la informacin de alto reconocimiento. Mediante LSTM multinivel, realizamos la fusin entre la adquisicin de informacin semntica global y las caractersticas de profundidad en distintos niveles, de modo que las capas totalmente conectadas con informacin de clasificacin rica puedan proporcionar un mecanismo de atencin al marco para la capa de informacin espacial. Las MDF slo necesitan actuar sobre imgenes RGB. Mediante experimentos en tres conjuntos de datos experimentales universales de reconocimiento de acciones, UCF10, UCF11 y HMDB51, se concluye que la red MDF puede alcanzar una precisin comparable a la de dos flujos (RGB y flujo ptico) que requiere la importacin tanto de datos de fotogramas como de datos de flujo ptico en tareas de clasificacin de vdeo.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento