El contexto, como las escenas y los objetos, desempeña un papel importante en el reconocimiento de emociones en vídeo. La precisión del reconocimiento de las emociones puede mejorar aún más si se incorpora la información del contexto. Aunque las investigaciones anteriores han tenido en cuenta la información del contexto, las pistas emocionales contenidas en diferentes imágenes pueden ser diferentes, lo que a menudo se ignora. Para abordar el problema de la diferencia de emociones entre diferentes modos y diferentes imágenes, este trabajo propone una red de fusión multimodal basada en la atención jerárquica para el reconocimiento de emociones en vídeo, que consiste en un módulo de extracción de características multimodales y un módulo de fusión de características multimodales. El módulo de extracción de características multimodales tiene tres subredes que se utilizan para extraer características de las imágenes faciales, de la escena y globales. Cada subred consta de dos ramas, en las que la primera extrae las características de los distintos modos, y la otra genera la puntuación de la emoción para cada imagen. Las características y las puntuaciones de emoción de todas las imágenes de una modalidad se agregan para generar la característica de emoción de la modalidad. El otro módulo toma las características multimodales como entrada y genera la puntuación de emoción de cada modalidad. Por último, se agregan las características y las puntuaciones de emoción de los múltiples modos, y se produce la representación final de la emoción del vídeo. Los resultados experimentales muestran que nuestro método propuesto es eficaz en el conjunto de datos de reconocimiento de emociones.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículos:
Cranioplastia y Derivación Subdural-Peritoneal Simultáneas para Higroma Subdural Sintomático Contralateral tras Craneotomía Descompresiva.
Artículos:
Fonones acústicos en nanocables con heteroestructuras integradas
Artículos:
Estructura entre capas de una molécula bioactiva, 2-aminoetanosulfonato, intercalada en hidróxidos dobles estratificados que contienen calcio
Artículos:
Observaciones sobre la migración de esporas de bacilo fuera de una instalación contaminada durante un estudio de eficacia de descontaminación
Artículos:
Los transportadores de membrana como mediadores de los efectos y efectos secundarios del cisplatino
Tesis y Trabajos de grado:
Sistema de costos por órdenes de producción para determinar la rentabilidad de la empresa de lácteos “San Agustín” Cía. Ltda., ubicada en la parroquia de Pintag, provincia de Pichincha
Artículos:
Generación de Baño Líquido Mediante Gas Natural Para el Arranque de Celdas Electrolíticas en CVG Alcasa
Artículos:
Arquitectura robótica inteligente con visión artificial 3D
Showroom:
Bombas centrífugas