Biblioteca122.739 documentos en línea

Artículo

Development of High Accuracy Classifier for the Speaker Recognition SystemDesarrollo de un clasificador de alta precisión para el sistema de reconocimiento de hablantes

Resumen

La señal de voz está enriquecida con multitud de características que se utilizan para el reconocimiento biométrico y otras aplicaciones como el reconocimiento de género y de emociones. Las condiciones del canal, manifestadas por el ruido de fondo y la reverberación, son los principales retos que provocan cambios de características en los datos de prueba y de entrenamiento. En este trabajo, se elabora un modelo híbrido de identificación de hablantes para obtener características del habla consistentes y una alta precisión de reconocimiento. Las características que utilizan los coeficientes del espectro de frecuencias de Mel (MFCC) se han mejorado incorporando un coeficiente de frecuencia de tono del análisis del dominio del tiempo del habla. Para mejorar la inmunidad al ruido, proponemos una red neuronal de una sola capa oculta (FFNN) ajustada mediante un algoritmo de optimización de enjambre de partículas (OPSO). El modelo propuesto se somete a pruebas de validación cruzada de 10 veces sobre diferentes niveles de Ruido Blanco Gaussiano Adaptativo (AWGN) (0-50 dB). Se obtuvo una precisión de reconocimiento del 97,83% con el modelo propuesto en entornos de voz limpios. Sin embargo, un canal ruidoso tiene un impacto menor en el modelo propuesto en comparación con otros clasificadores de referencia como el FFNN simple, el bosque aleatorio (RF), el vecino más cercano (KNN) y la máquina de vectores de apoyo (SVM).

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento