Biblioteca122.294 documentos en línea

Artículo

Using SVD on Clusters to Improve Precision of Interdocument Similarity MeasureUso de SVD en clusters para mejorar la precisión de la medida de similitud entre documentos

Resumen

Recientemente, se ha propuesto la LSI (Indexación Semántica Latente) basada en la SVD (Descomposición de Valores Singulares) para superar los problemas de polisemia y homonimia en la correspondencia léxica tradicional. Sin embargo, se le suele criticar por su escaso poder de discriminación para representar documentos, aunque se ha validado por su buena calidad representativa. En este trabajo, se propone la SVD en clusters para mejorar el poder discriminativo de LSI. La contribución de este trabajo tiene tres vertientes. En primer lugar, hacemos un estudio de los métodos de álgebra lineal existentes para LSI, incluyendo tanto los métodos basados en SVD como los no basados en SVD. En segundo lugar, proponemos la SVD en clusters para LSI y explicamos teóricamente que la expansión de la dimensión de los vectores de los documentos y la proyección de la dimensión utilizando la SVD son las dos manipulaciones que implica la SVD en clusters. Además, desarrollamos procesos de actualización para incorporar nuevos documentos y términos en una matriz descompuesta mediante SVD en clusters. En tercer lugar, se utilizan dos corpus, uno chino y otro inglés, para evaluar el rendimiento de los métodos propuestos. Los experimentos demuestran que, en cierta medida, la SVD sobre clusters puede mejorar la precisión de la medida de similitud interdocumental en comparación con otros métodos LSI basados en la SVD.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento