El reconocimiento de emociones en el habla (SER) es un tema de investigación importante. Las características de imagen como los espectrogramas son una de las formas comunes de extraer información del habla. En el área del reconocimiento de imágenes, un tipo de red relativamente novedoso llamado redes de cápsulas ha mostrado buenos y prometedores resultados. Este estudio tiene como objetivo utilizar redes de cápsulas para codificar información espacial de los espectrogramas y analizar su rendimiento cuando se combina con diferentes funciones de pérdida. Experimentos que comparan la red de cápsulas con modelos de trabajos anteriores muestran que la red de cápsulas tiene un mejor rendimiento que ellos.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Un Modelo Numérico Cuasi-3D para la Inyección de Lechada en una Fractura Paralela Basado en el Método de Volumen Finito
Artículo:
Investigación sobre la optimización del diseño de casas residenciales prefabricadas basada en la tecnología BIM.
Artículo:
Un Método de Encriptación de Imágenes en Tiempo Real para un Sistema de Control de Servovisual de Péndulo Invertido en Red
Artículo:
Cartografía ciega para ataques de canal lateral: Cartografía de correlación cruzada.
Artículo:
Linkboost: Un algoritmo de predicción de enlaces para resolver el problema de vulnerabilidad de red en casos que involucran información incompleta.