La señal de voz está enriquecida con multitud de características que se utilizan para el reconocimiento biométrico y otras aplicaciones como el reconocimiento de género y de emociones. Las condiciones del canal, manifestadas por el ruido de fondo y la reverberación, son los principales retos que provocan cambios de características en los datos de prueba y de entrenamiento. En este trabajo, se elabora un modelo híbrido de identificación de hablantes para obtener características del habla consistentes y una alta precisión de reconocimiento. Las características que utilizan los coeficientes del espectro de frecuencias de Mel (MFCC) se han mejorado incorporando un coeficiente de frecuencia de tono del análisis del dominio del tiempo del habla. Para mejorar la inmunidad al ruido, proponemos una red neuronal de una sola capa oculta (FFNN) ajustada mediante un algoritmo de optimización de enjambre de partículas (OPSO). El modelo propuesto se somete a pruebas de validación cruzada de 10 veces sobre diferentes niveles de Ruido Blanco Gaussiano Adaptativo (AWGN) (0-50 dB). Se obtuvo una precisión de reconocimiento del 97,83% con el modelo propuesto en entornos de voz limpios. Sin embargo, un canal ruidoso tiene un impacto menor en el modelo propuesto en comparación con otros clasificadores de referencia como el FFNN simple, el bosque aleatorio (RF), el vecino más cercano (KNN) y la máquina de vectores de apoyo (SVM).
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Análisis de la tecnología de descripción inteligente de vídeos de voleibol basada en la red de memoria informática y el mecanismo de atención
Artículo:
Mecanismo de infiltración y defiltración de agua a través de la zeolita ZSM-5: efecto del calentamiento y de la concentración de cloruro sódico
Artículo:
Avances sobre péptidos o proteínas de fuentes marinas con actividad antibacteriana y antiendotóxica
Artículo:
El receptor de acetilcolina nicotínico como objetivo para el desarrollo de fármacos antidepresivos.
Artículo:
Un nuevo sistema de teleasistencia basado en un robot móvil para ancianos en casa
Artículo:
Creación de empresas y estrategia : reflexiones desde el enfoque de recursos
Libro:
Ergonomía en los sistemas de trabajo
Artículo:
La gestión de las relaciones con los clientes como característica de la alta rentabilidad empresarial
Artículo:
Los web services como herramienta generadora de valor en las organizaciones