El rendimiento de la detección de objetos basada en redes neuronales convolucionales (CNN) ha alcanzado un éxito increíble. Sin embargo, los algoritmos existentes basados en CNN adolecen del problema de que los objetos a pequeña escala son difíciles de detectar porque pueden haber perdido su respuesta cuando el mapa de características ha alcanzado cierta profundidad, y es habitual que la escala de los objetos (como coches, autobuses y peatones) contenidos en las imágenes y vídeos de tráfico varíe mucho. En este artículo, presentamos una red neuronal convolucional de 32 capas denominada MBNet para la detección rápida de objetos en escenas de tráfico. Nuestro modelo utiliza tres ramas de detección, en las que se utilizan mapas de características con un tamaño de 16 × 16, 32 × 32 y 64 × 64, respectivamente, para optimizar la detección de objetos de tamaño grande, medio y pequeño. Mediante una función de pérdida multitarea, nuestro modelo puede entrenarse de principio a fin. Los resultados experimentales muestran que nuestro modelo alcanza el rendimiento más avanzado en términos de precisión y tasa de recuperación, y la velocidad de detección (hasta 33 fps) es rápida, lo que puede satisfacer los requisitos de tiempo real de la industria.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Biotecnología vegetal en el siglo XXI : retos futuros
Artículo:
Evaluación de tareas mentales para interfaces cerebro-ordenador híbridas NIRS-EEG
Artículo:
Evaluación del proceso de administración de medicamentos por parte de enfermeros
Tesis:
Optimización de un medio de cultivo para la producción de biomasa de la cepa Pseudomonas putida UA 44 aislada del suelo bananero de Uraba –Antioquia
Artículo:
Efectos de la temperatura y las precipitaciones en las migraciones de reproducción de especies de anfibios en el sureste de Noruega