La factorización de matrices no negativas (NMF) descompone una matriz no negativa de alta dimensión en el producto de dos matrices no negativas de dimensión reducida. Sin embargo, la NMF convencional ni califica conjuntos de datos a gran escala, ya que mantiene todos los datos en memoria, ni preserva la estructura geométrica de los datos, necesaria en algunas tareas prácticas. En este trabajo, proponemos un NMF paralelo con el método de regularización múltiple (PNMF-M) para superar las deficiencias antes mencionadas mediante la paralelización del NMF regularizado múltiple en un sistema informático distribuido. En particular, PNMF-M distribuye tanto las muestras de datos como las matrices factoriales a múltiples nodos de computación en lugar de cargar todo el conjunto de datos en un único nodo y actualiza ambas matrices factoriales localmente en cada nodo. De este modo, PNMF-M consigue resolver la presión del consumo de memoria para conjuntos de datos a gran escala y acelerar el cálculo mediante la paralelización. Para construir la matriz de adyacencia en la regularización de múltiples, proponemos un método de construcción de grafos distribuidos en dos pasos, que se demuestra equivalente al método de construcción por lotes. Los resultados experimentales en corpus de texto populares y conjuntos de datos de imágenes demuestran que PNMF-M mejora significativamente tanto la escalabilidad como la eficiencia temporal del NMF convencional gracias a la paralelización en el sistema de computación distribuida; mientras tanto, mejora significativamente la capacidad de representación del NMF convencional gracias a la regularización múltiple incorporada.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Seguridad de la computación en nube mediante un sistema de inferencia neural difusa adaptable
Artículo:
Cuidado infantil de los abuelos y segundo nacimiento en China: Evidencia de un modelo dinámico y estudio empírico
Artículo:
Mitigación de la radiación en las comunicaciones por línea eléctrica mediante inversión temporal
Artículo:
Descenso de gradiente minilotes robusto y distribuido con preservación de la privacidad
Artículo:
Investigación sobre la optimización de canales del radar de vigilancia de objetivos de aviación ADS-B basada en un algoritmo de filtrado mejorado.