En este documento, estudiamos el desafío de la recuperación de imagen a video, que utiliza la imagen de consulta para buscar cuadros relevantes de una gran colección de videos. Se propone un nuevo marco basado en redes neuronales convolucionales (CNN) para realizar la recuperación de video a gran escala con bajo costo de almacenamiento y alta eficiencia de búsqueda. Nuestro marco consiste en el algoritmo de extracción de cuadros clave y la estrategia de agregación de características. Específicamente, el algoritmo de extracción de cuadros clave aprovecha la idea de agrupamiento para eliminar información redundante en los datos de video y reducir en gran medida el costo de almacenamiento. La estrategia de agregación de características adopta el promedio de agrupación para codificar características convolucionales locales profundas seguido de una recuperación de gruesa a fina, lo que permite una recuperación rápida en la base de datos de video a gran escala. Los resultados de experimentos extensos en dos conjuntos de datos públicos demuestran que el método propuesto logra una eficiencia superior
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Innovación abierta en el proceso de investigación y desarrollo: un análisis de la cooperación entre empresas de automoción y universidades
Artículo:
Estudio del desempeño de la concatenación de ecualizador de baja complejidad con código NRZ-LDPC irregular para canales inalámbricos móviles
Artículo:
Un modelo adaptativo de reducción de ruido en imágenes basado en regularizaciones de Tikhonov y TV.
Artículo:
Análisis de la recuperación personalizada de usuarios de archivos digitales multimedia dependiente del algoritmo de red neuronal BP.
Artículo:
Diseño de un modelo semi-inteligente de búsqueda de metadatos en la web, aplicado a sistemas data warehousing