La similitud distribucional ha atraído una atención considerable en el campo del procesamiento del lenguaje natural como medio automático de contrarrestar el omnipresente problema de los datos dispersos. Como lengua logográfica, las palabras chinas están formadas por caracteres y cada uno de ellos se compone de uno o más radicales. Los significados de los caracteres suelen estar muy relacionados con las palabras que los contienen. Asimismo, los radicales suelen contribuir de forma predecible al significado de un carácter: los caracteres que tienen los mismos componentes tienden a tener significados similares o relacionados. En este artículo, utilizamos estas propiedades de la lengua china para mejorar el cálculo de la similitud de las palabras chinas. Dada una palabra de contenido, primero extraemos palabras similares basándonos en un corpus amplio y una puntuación de similitud para clasificarlas. A continuación, ajustamos esta clasificación en función de los caracteres y componentes compartidos entre la palabra similar y la palabra objetivo. Los experimentos con dos conjuntos de datos de referencia demuestran que el rango ajustado es superior y se aproxima más a los juicios humanos que el rango original. Además de la evaluación cuantitativa, examinamos las razones que explican los errores basándonos en fenómenos lingüísticos.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Sincronización para una Clase de Sistema Hipercrítico de Orden Fraccional y su Aplicación
Artículo:
Estimación de la derivada parcial para un proceso de valor funcional subyacente en un marco unificado.
Artículo:
Un Enfoque de Programación No Lineal Difusa para Optimizar el Rendimiento de una Regla de Suavizado de Fluctuaciones de Cuatro Objetivos en una Fábrica de Fabricación de Obleas
Artículo:
Una nota sobre integrales de Marcinkiewicz a lo largo de subvariedades de tipo finito
Artículo:
Nuevos preacondicionadores triangulares de bloque para sistemas lineales de punto de silla con bloques (1,1) altamente singulares