Aunque en esta era de Big Data ha sido más fácil construir grandes conjuntos de datos de rostros mediante la recopilación de imágenes de Internet, el proceso de anotación manual, que consume mucho tiempo, impide a los investigadores construir otros más grandes, lo que hace que la limpieza automática de etiquetas ruidosas sea muy deseable. Sin embargo, la identificación de rostros mal etiquetados por la máquina es bastante desafiante porque la diversidad de las imágenes de la cara de una persona que se capturan salvajemente en todas las edades es extraordinariamente rica. En vista de ello, proponemos un método de limpieza basado en gráficos que emplea principalmente el algoritmo de detección de comunidades y modelos CNN profundos para eliminar las imágenes mal etiquetadas. Como la diversidad de rostros se conserva en múltiples comunidades grandes, nuestros resultados de limpieza tienen tanto una alta limpieza como una rica diversidad de datos. Con nuestro método, limpiamos el amplísimo conjunto de datos de rostros MS-Celeb-1M (aproximadamente 10 millones de imágenes con etiquetas ruidosas) y obtenemos una versión limpia del mismo denominada C-MS-Celeb (6.464.018 imágenes de 94.682 celebridades). Al entrenar un modelo de red única con nuestro conjunto de datos C-MS-Celeb, sin ajuste fino, conseguimos un 99,67
t en la prueba de referencia de reconocimiento facial LFW, que es comparable a otros resultados del estado del arte. Esto demuestra los efectos positivos de la limpieza de datos en el entrenamiento del modelo. Hasta donde sabemos, nuestro C-MS-Celeb es el mayor conjunto de datos limpios de rostros que está disponible públicamente hasta ahora, lo que beneficiará a los investigadores de reconocimiento de rostros.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Un algoritmo mejorado de optimización por enjambre de partículas con crianza elitista para la optimización sin restricciones
Artículo:
Evaluación del impacto de Big Data en la gestión de la educación superior basada en el algoritmo de muestreo de agrupación variable en el tiempo
Artículo:
Minería de preferencias mediante el modelo de conjuntos rugosos de vecindad en dos universos
Artículo:
Una Solución Potencial para el Dispositivo Mínimamente Invasivo en Cirugía Oral: Evaluación de los resultados quirúrgicos en ratas
Artículo:
Ventajas y desventajas del tratamiento con oxígeno hiperbárico en ratones con obesidad, hiperlipidemia y esteatohepatitis.
Artículo:
Creación de empresas y estrategia : reflexiones desde el enfoque de recursos
Artículo:
La gestión de las relaciones con los clientes como característica de la alta rentabilidad empresarial
Artículo:
Análisis socioeconómico de la problemática de los desechos plásticos en el mar
Artículo:
Los web services como herramienta generadora de valor en las organizaciones