Recientemente, se ha propuesto la LSI (Indexación Semántica Latente) basada en la SVD (Descomposición de Valores Singulares) para superar los problemas de polisemia y homonimia en la correspondencia léxica tradicional. Sin embargo, se le suele criticar por su escaso poder de discriminación para representar documentos, aunque se ha validado por su buena calidad representativa. En este trabajo, se propone la SVD en clusters para mejorar el poder discriminativo de LSI. La contribución de este trabajo tiene tres vertientes. En primer lugar, hacemos un estudio de los métodos de álgebra lineal existentes para LSI, incluyendo tanto los métodos basados en SVD como los no basados en SVD. En segundo lugar, proponemos la SVD en clusters para LSI y explicamos teóricamente que la expansión de la dimensión de los vectores de los documentos y la proyección de la dimensión utilizando la SVD son las dos manipulaciones que implica la SVD en clusters. Además, desarrollamos procesos de actualización para incorporar nuevos documentos y términos en una matriz descompuesta mediante SVD en clusters. En tercer lugar, se utilizan dos corpus, uno chino y otro inglés, para evaluar el rendimiento de los métodos propuestos. Los experimentos demuestran que, en cierta medida, la SVD sobre clusters puede mejorar la precisión de la medida de similitud interdocumental en comparación con otros métodos LSI basados en la SVD.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Un Histograma Revisitado de Descriptor Orientado para la Clasificación de Imágenes de Color Facial Basado en la Fusión de Información de Color
Artículo:
Efecto protector del aceite de semilla de (Ker Gawl.) Haw. sobre la nefrotoxicidad inducida por gentamicina: un análisis bioquímico e histológico
Video:
Progresos tecnológicos en la industria textil outdoor: tejidos inteligentes
Artículo:
Comparación de un módulo de sensor inercial en miniatura de bajo coste y un giroscopio de fibra óptica para evaluaciones clínicas del equilibrio y la marcha
Artículo:
Síntesis de nanomateriales mediante generación de plasma en líquido