Con el rápido desarrollo de la tecnología de Internet, se han logrado avances en todas las ramas de la visión por computadora. Especialmente en la detección de imágenes y el seguimiento de objetivos, las técnicas de aprendizaje profundo como las redes neuronales convolucionales han logrado excelentes resultados. Con el fin de explorar la aplicabilidad de la tecnología de aprendizaje automático en el campo del reconocimiento y extracción de texto en video, se propone una red YOLOv3 basada en la transformación de características multiescala y la fusión de migración para mejorar la precisión de la detección de texto en inglés en escenas naturales en video. En primer lugar, con el objetivo de abordar el problema de la detección de objetivos multiescala en los fotogramas clave de video, basándose en la red YOLOv3, se utiliza el módulo de conversión de escala del algoritmo STDN para reducir el mapa de características de bajo nivel, y se construye una red de base con reutilización de características para extraer características. Luego, se utiliza el m
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Separando el Carácter Chino del Fondo Ruidoso Utilizando GAN
Artículo:
Identificación de particiones en un grupo homogéneo de actividades mediante dispositivos móviles
Artículo:
Adquisición de imágenes de animación de películas en 3D y procesamiento de características basado en la última tecnología de reconstrucción virtual.
Artículo:
Detección de agarre bajo oclusiones utilizando características SIFT
Artículo:
Visualización en 3D, monitoreo y alerta temprana de la deformación superficial en áreas de subsidencia basado en SIG.