Separación ciega de fuentes no-determinada aplicada a mezclas de voz con base en la transformada wavelet discreta
Undetermined blind source separation of speech mixtures based on discrete wavelet transform
La separación ciega de fuentes, conocida como BSS por sus siglas en inglés (Blind Source Separation),es una técnica de procesamiento de señales que consiste en estimar fuentes en señales mezcladaslinealmente, utilizando métodos como el ICA, para señales fuentes estadísticamente independientes.Uno de los algoritmos BSS más conocidos es el algoritmo JADE, el cual exige que el número de señalesindependientes coincida con el número de señales observadas (sensores). En situaciones reales, elnúmero de sensores es menor al número de señales fuentes (BSS no-determinado) y el problema no tienesolución. En este proyecto se propone una solución para BSS no-determinado, adicionando una etapa depreprocesamiento y una etapa de descomposición basada en la transformada wavelet discreta. Nuestromodelo, el cual hemos denominado DWT+BSS, crea una señal virtual observada a partir de una señalreal observada y utiliza los coeficientes wavelet de las señales observadas como entradas al algoritmoclásico JADE. El modelo se valida con señales de voz y audio, obteniendo índices de similitud entre lasseñales fuentes y las estimadas por encima de 0,7.
INTRODUCCIÓN
La separación ciega de fuentes (BSS) es una técnica de procesamiento de señales que consiste en estimar señales fuentes a partir de sus mezclas lineales observadas [1-2]. Tradicionalmente, las señales fuentes deben ser estadísticamente independientes y debe existir el mismo número de señales observadas como de señales fuentes. Uno de los métodos matemáticos que más se ha utilizado en el problema BSS es el método de análisis de componentes independientes (ICA), el cual ha sido el punto de partida de algoritmos como el JADE [3-5].
En los últimos años la transformada wavelet se ha utilizado en modelos BSS, con el fin de mejorar los resultados obtenidos a través de los algoritmos basados en ICA. En [6], los autores utilizan la transformada wavelet como etapa de preprocesamiento de las señales observadas y las señales obtenidas son más similares a las señales fuentes originales que con el solo algoritmo BSS tradicional. En [7], la entrada al algoritmo BSS corresponde a todos los coeficientes wavelet de las señales observadas; mientras en [8] se seleccionan los coeficientes wavelet más representativos a partir de un criterio de análisis estadístico.
Por otro lado, en ambientes reales en los que el número de sensores o señales observadas, n, es menor al número de fuentes, m, el método ICA no se puede utilizar para separar las señales fuentes, ya que éste necesita que n sea igual a m. A este tipo de problemas se le conoce como BSS no-determinado.
Recursos
-
Formatopdf
-
Idioma:español
-
Tamaño:185 kb