Biblioteca122.739 documentos en línea

Artículo

Deep Metric Learning-Assisted 3D Audio-Visual Speaker Tracking via Two-Layer Particle FilterSeguimiento de altavoces audiovisuales 3D asistido por aprendizaje métrico profundo a través de un filtro de partículas de dos capas.

Resumen

Para el seguimiento de altavoces, integrar información multimodal de audio y video proporciona una solución efectiva y prometedora. Los desafíos actuales se centran en la construcción de un modelo de observación estable. Con este fin, proponemos un rastreador de altavoces audiovisuales en 3D asistido por aprendizaje métrico profundo en el marco de filtro de partículas de dos capas. En primer lugar, se aplica el modelo de movimiento guiado por audio para generar muestras candidatas en la estructura jerárquica que consiste en una capa de audio y una capa visual. Luego, se propone un modelo de observación estable con una red Siamesa diseñada, que proporciona la probabilidad basada en la similitud para calcular los pesos de las partículas. La posición del altavoz se estima utilizando un conjunto óptimo de partículas, que integra las decisiones de las partículas de audio y las partículas visuales. Finalmente, se adopta una estrategia de actualización de plantilla basada en mecanismos

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento