La comprensión de escenas consiste en predecir una etiqueta de clase en cada píxel de una imagen. En este estudio, proponemos un marco de segmentación semántica basado en redes generativas adversarias clásicas (GAN) para entrenar un modelo de segmentación semántica completamente convolucional junto con una red adversaria. Para mejorar la consistencia de la imagen segmentada, se adoptan potenciales de alto orden en lugar de potenciales unarios o de pares. Realizamos los potenciales de alto orden sustituyendo la red adversaria por un modelo CRF, que puede mejorar continuamente la consistencia y los detalles de la imagen semántica segmentada hasta que no pueda discriminar el resultado segmentado del verdadero. Se llevaron a cabo una serie de experimentos en los conjuntos de datos PASCAL VOC 2012 y Cityscapes, y las evaluaciones cuantitativas y cualitativas han demostrado la efectividad de nuestro enfoque propuesto.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Obstáculos a la integración efectiva de las TIC desarrolladas para las PYME en las zonas rurales de Nigeria
Artículo:
Transmisión de video escalable para redes inalámbricas de un solo salto utilizando un protocolo MAC de acceso basado en contención.
Artículo:
Clasificación automática y análisis de multimedia musical combinado con el Modelo Oculto de Markov.
Video:
Modelado de procesos de negocios con GeneXus BPM Suite - Rodolfo Roballo, GeneXus
Video:
Entrevistas de programación: problema de cambio en monedas (programación dinámica)