Information Retrieval Model with Query Expansion and User Preference Profile
Modelo de recuperación de información con ampliación de consultas y perfil de preferencias del usuario
Comprender la intención de búsqueda del usuario permite identificar y extraer de la información disponible los resultados de búsqueda más relevantes y personalizados, de acuerdo con sus necesidades. Este artículo propone un algoritmo para la recuperación de información relevante que combina el perfil de preferencias del usuario y la expansión de la consulta para obtener resultados de búsqueda relevantes y personalizados. El proceso de recuperación de información se valida utilizando las métricas Precision, Recall y Mean Average Precision (MAP) aplicadas a un conjunto de datos que contiene los documentos estandarizados y los perfiles de preferencias. Los resultados permitieron demostrar que el algoritmo mejora el proceso de recuperación de información al encontrar documentos de mejor calidad y mayor relevancia para las necesidades de los usuarios.
I. INTRODUCCIÓN
Los motores de búsqueda tradicionales generalmente utilizan técnicas estadísticas que determinan la relevancia mediante la concordancia de palabras clave sin comprender completamente las intenciones de búsqueda del usuario y el contexto implícito de la información indexada [ 1 - 2 ]. Recuperar información relevante y personalizada plantea un desafío para los Sistemas de Recuperación de Información (IRS) que necesitan satisfacer la necesidad de un usuario presentada en forma de pregunta y especificada a través de un conjunto de palabras clave mediante el análisis de una colección de documentos con volumen y formato variables [ 3 ] . El proceso de Recuperación de Información (RI) se ha mejorado mediante el desarrollo de varios modelos [ 4 - 8 ] enfocados a resolver problemas relacionados con:
- La dificultad para identificar y comprender las necesidades del usuario escritas en lenguaje natural al ingresar términos exactos o ambiguos limita la recuperación de documentos relevantes.
- La recuperación de documentos por término estadístico sin analizar el contexto de la pregunta y la información almacenada.
Para solucionar las principales falencias identificadas en los IRS, proponemos procesar documentos [ 9 - 11 ], consultas [ 12 - 15 ] y el perfil del usuario [ 2 , 16 , 17 ] para mejorar el IR mediante el uso de ontologías y el análisis del perfil del usuario. comportamiento.
En el proceso de IR, aunque conocer la intención de búsqueda de los usuarios es importante para comprender sus necesidades, se aplican algoritmos de relevancia que combinan perfil de preferencia [ 16 - 18 ], expansión de consultas [ 2 , 14 ] y anotaciones semánticas [ 2 , 9 , 11 ]. permite mejorar los resultados de búsqueda obtenidos.
Recursos
-
Formatopdf
-
Idioma:inglés
-
Tamaño:524 kb