Biblioteca122.294 documentos en línea

Artículo

An Adaptive Method Based on Multiscale Dilated Convolutional Network for Binaural Speech Source LocalizationUn Método Adaptativo Basado en una Red Convolucional Dilatada Multiescala para la Localización de la Fuente de Habla Binaural

Resumen

La mayoría de los modelos de localización de fuentes de habla binaural tienen un rendimiento deficiente en situaciones inusualmente ruidosas y reverberantes. Aquí, este problema se aborda modelando una red neuronal convolucional (CNN) dilatada multisegmentada. La función de correlación cruzada relacionada con el tiempo (CCF) y las diferencias de nivel interaural relacionadas con la energía (ILD) se preprocesan en ramas separadas de la red convolucional dilatada. La CNN dilatada multisegmentada puede codificar representaciones discriminativas para CCF e ILD, respectivamente. Después de la codificación, las representaciones interaurales individuales se fusionan para mapear la dirección de la fuente. Además, para mejorar la adaptación de parámetros, se propone una nueva entropía semiadaptativa para entrenar la red bajo restricciones direccionales. Los resultados experimentales muestran que el método propuesto puede localizar de manera adaptativa fuentes de habla en entornos ruidosos y reverberantes simulados.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento