Biblioteca122.739 documentos en línea

Artículos

An Improved Speech Segmentation and Clustering Algorithm Based on SOM and K-MeansAlgoritmo mejorado de segmentación y agrupación del habla basado en SOM y K-Means

Resumen

Este artículo estudia la segmentación y agrupación del habla de los locutores. Con el fin de mejorar la precisión de la detección de los extremos del habla, se sustituye el umbral doble tradicional de la tasa media de cruce por cero a corto plazo por una característica mejor del centroide del espectro y se utilizan los máximos locales del histograma de la secuencia de características estadísticas para seleccionar el umbral, y se propone un nuevo algoritmo de detección de los extremos del habla. En comparación con el algoritmo tradicional de doble umbral, mejora eficazmente la precisión de la detección y la antinoise en SNR baja. El algoritmo k-means de clustering convencional necesita dar el número de clusters por adelantado y se ve muy afectado por la elección de los centros de cluster iniciales. Al mismo tiempo, el algoritmo de red neuronal autoorganizada converge lentamente y no puede proporcionar información precisa sobre la agrupación. Se propone un algoritmo mejorado de agrupación de oradores k-means basado en una red neuronal autoorganizada. El número de clusters se predice mediante la situación ganadora de las neuronas competitivas en la red entrenada, y los pesos de las neuronas se utilizan como centros de cluster iniciales del algoritmo k-means. Los resultados experimentales de la segmentación del habla mixta multipersona muestran que el algoritmo propuesto puede mejorar eficazmente la precisión de la agrupación del habla y compensar las deficiencias del algoritmo k-means y del algoritmo de red neuronal autoorganizada.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento