Biblioteca122.294 documentos en línea

Artículo

Real-Time Audio-Visual Analysis for Multiperson VideoconferencingAnálisis audiovisual en tiempo real para videoconferencias multipersonales.

Resumen

Describimos el diseño de un sistema que consta de varios componentes de procesamiento de audio y video en tiempo real de última generación que permiten la manipulación de flujos multimodales (por ejemplo, edición automática en línea para aplicaciones de videoconferencias multiparte) en entornos abiertos y sin restricciones. Los algoritmos subyacentes están diseñados para permitir que múltiples personas entren, interactúen y salgan de la escena observable sin restricciones. Incluyen la localización continua de objetos de audio y su aplicación para la codificación espacial de objetos de audio, la detección y seguimiento de caras, la estimación de posturas de cabeza y enfoque visual de atención, la detección y localización de eventos verbales y paralingüísticos, y la asociación y fusión de estos diferentes eventos. Combinados todos juntos, representan flujos multimodales con objetos de audio y objetos de video semánticos y proporcionan información semántica para sistemas de manipulación de flujos (como un director virtual). Se han realizado varios experimentos para evaluar el rend

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento