El reciente progreso en el aprendizaje profundo, en particular en los modelos generativos, facilita la síntesis de rostros falsificados sofisticados en videos, lo que conlleva graves amenazas en las redes sociales en cuanto a la privacidad personal y la reputación. Por lo tanto, es altamente necesario desarrollar enfoques forenses para distinguir esos videos falsificados de los auténticos. Los trabajos existentes se centran en explorar señales a nivel de cuadro pero son insuficientes en aprovechar la abundante información temporal. Aunque algunos enfoques identifican las falsificaciones desde la perspectiva de la inconsistencia de movimiento, hasta ahora no existe una estrategia prometedora de fusión de características espacio-temporales. Con este fin, proponemos el módulo de Agregación Espacio-Temporal por Canales (CWSA) para fusionar características profundas de cuadros de video continuos sin unidades recurrentes. Nuestro enfoque comienza recortando la región facial con algo de fondo restante, lo que transforma el objetivo de aprendizaje de manipulaciones
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
CCID: Método de Distinción de Identidad de Correlación Cruzada para Detectar Shrew DDoS
Artículo:
El Análisis de Predicción del Riesgo de Incumplimiento en Plataformas de Préstamos entre Particulares Basado en Modelos Comparativos.
Artículo:
Diseño de controlador estable para panel solar flexible mediante el método de modelado en forma de bucle H.
Artículo:
BBAAS: esquema de autenticación anónima basado en blockchain para ofrecer una comunicación segura en las VANET
Artículo:
Problema de enrutamiento de vehículos heterogéneos de múltiples depósitos para una variedad de materiales peligrosos con análisis de riesgos.