Biblioteca122.294 documentos en línea

Artículo

A Novel DBN Feature Fusion Model for Cross-Corpus Speech Emotion RecognitionUn nuevo modelo de fusión de características DBN para el reconocimiento de la emoción del habla en corpus cruzados

Resumen

La fusión de características de fuentes separadas es la dificultad técnica actual del reconocimiento de la emoción del habla entre corpus. El objetivo de este trabajo es, basándose en redes de creencia profunda (DBN) en aprendizaje profundo, utilizar la información emocional oculta en el diagrama de espectro del habla (espectrograma) como características de imagen y luego implementar la fusión de características con las características de emoción tradicionales. En primer lugar, basándose en el análisis del espectrograma mediante el modelo STB/Itti, las nuevas características del espectrograma se extraen del color, el brillo y la orientación, respectivamente; a continuación, utilizando dos modelos DBN alternativos, fusionan las características tradicionales y las del espectrograma, lo que aumenta la escala del subconjunto de características y la capacidad de caracterización de la emoción. Mediante el experimento con la base de datos ABC y corpus chinos, el nuevo subconjunto de características comparado con las características tradicionales de emoción del habla, el resultado de reconocimiento en corpus cruzados, avanza claramente en un 8,8%. El método propuesto proporciona una nueva idea para la fusión de características de reconocimiento de emociones.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento