El reconocimiento de las actividades humanas es un campo esencial en la visión por ordenador. La mayor parte de la actividad humana consiste en la interacción entre los seres humanos y los objetos. En los últimos años se han realizado muchos trabajos exitosos sobre el reconocimiento de la interacción hombre-objeto (HOI) y se han obtenido resultados aceptables. Sin embargo, son totalmente supervisados y necesitan entrenar datos etiquetados para todas las HOI. Debido al enorme espacio de interacciones hombre-objeto, enumerar y proporcionar los datos de entrenamiento para todas las categorías posibles es costoso y poco práctico. Proponemos un enfoque para escalar el reconocimiento de interacciones hombre-objeto en datos de vídeo mediante la técnica de aprendizaje de cero disparos para resolver este problema. Nuestro método reconoce un verbo y un objeto del vídeo y hace una clase de HOI. El reconocimiento de los verbos y objetos en lugar de los HOI permite identificar una nueva combinación de verbos y objetos. Así, se puede identificar una nueva clase HOI, que no es vista por el sistema de reconocimiento. Introducimos una arquitectura de red neuronal que puede entender y representar los datos de vídeo. El sistema propuesto aprende los verbos y los objetos a partir de los datos de entrenamiento disponibles en la fase de formación y puede identificar los pares verbo-objeto en un vídeo en el momento de la prueba. Así, el sistema puede identificar la clase HOI con diferentes combinaciones de objetos y verbos. Además, proponemos utilizar la información lateral para combinar los verbos y los objetos con el fin de formar pares verbo-objeto válidos. Esto ayuda a prevenir la detección de HOIs raros y probablemente erróneos. La información lateral procede de técnicas de incrustación de palabras. Además, proponemos un nuevo método de agregación de características para agregar las características de alto nivel extraídas de los fotogramas de vídeo antes de alimentar el clasificador. Demostramos que este método de agregación de características es más eficaz para las acciones que incluyen múltiples subacciones. Evaluamos nuestro sistema con el conjunto de datos desafiables Charades, introducido recientemente, que contiene muchas categorías HOI en los vídeos. Demostramos que nuestro sistema propuesto puede detectar clases de HOI no vistas, además del reconocimiento aceptable de los tipos vistos. Por lo tanto, el número de clases identificables por el sistema es mayor que el número de clases utilizadas para el entrenamiento.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Selección de personal multicriterio mediante el método VIKOR difuso modificado
Artículo:
Aplicación de la nanotecnología a la salud humana: Revolución en las ciencias biomédicas
Artículo:
Evaluación de la actividad anticancerígena y antimicrobiana de nanopartículas de plata formuladas con almidón poroso de caupí
Artículo:
Variación de la secuencia de la subunidad 1 de la citocromo c oxidasa mitocondrial en el cáncer de próstata
Artículo:
Análisis Dinámico del Patrón de Movimiento de Fuerza Isométrica Anormal entre el Hombro y la Articulación del Codo en Pacientes con Hemiplejia
Artículo:
Medicina de la conservación ¿una disciplina para médicos veterinarios?
Libro:
Tratamiento de aguas para consumo humano : plantas de filtración rápida. Manual II : diseño de plantas de tecnología apropiada
Artículo:
Configuración de los valores de María, antes y después de la violación, en Satanás de Mario Mendoza
Showroom:
Panel fotovoltaico: Dimensionamiento y funcionamiento