Biblioteca122.739 documentos en línea

Artículo

Replacing Out-of-Vocabulary Words with an Appropriate Synonym Based on Word2VnCRSustitución de palabras fuera de vocabulario por un sinónimo adecuado basado en Word2VnCR

Resumen

El problema más típico en un análisis de lenguaje natural es encontrar sinónimos de palabras fuera de vocabulario (OOV). Cuando alguien intenta entender una oración que contiene una palabra OOV, la persona determina el significado más apropiado de una palabra de reemplazo utilizando los significados de las palabras de co-ocurrencia bajo el mismo contexto basado en el sistema conceptual aprendido. En este estudio, se propone un algoritmo de relación palabra-a-vector y conceptual (Word2VnCR) que reemplaza una palabra OOV que conduce a un análisis morfémico erróneo con un sinónimo apropiado. El algoritmo Word2VnCR es una mejora sobre el algoritmo convencional Word2Vec, que tiene un problema al sugerir una palabra de reemplazo al no determinar la similitud de la palabra. Después de que se lleva a cabo el aprendizaje de incrustación de palabras utilizando el conjunto de datos de aprendizaje, se extraen los candidatos de palabras de reemplazo de la palabra OOV. Las similitudes semánticas de los candidatos de palabras de reemplazo extraídos se miden con las palabras vecinas circundantes de la palabra OOV, y se selecciona una palabra de reemplazo que tenga el valor de similitud más alto. Para evaluar el rendimiento del algoritmo propuesto Word2VnCR, se llevó a cabo un experimento comparativo utilizando los algoritmos Word2VnCR y Word2Vec. Como indican los resultados experimentales, el algoritmo propuesto muestra una precisión más alta que el algoritmo Word2Vec.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento