Biblioteca122.739 documentos en línea

Artículos

Sentence Classification Using N-Grams in Urdu Language TextClasificación de oraciones utilizando N-Gramas en texto en idioma urdu

Resumen

El uso de idiomas locales es común en las redes sociales y canales de noticias. Las personas comparten valiosos conocimientos sobre diversos temas relacionados con sus vidas en diferentes idiomas. Existe una gran cantidad de texto en varios idiomas locales en Internet que contiene información invaluable. El análisis de este tipo de contenido (texto en idiomas locales) sin duda ayudará a mejorar una serie de tareas de Procesamiento del Lenguaje Natural (PLN). La información extraída de los idiomas locales puede ser utilizada para desarrollar diversas aplicaciones que añadan un nuevo hito en el campo del PLN. En este artículo, presentamos una tarea de investigación aplicada, la clasificación de oraciones multiclase para texto en idioma urdu a nivel de oración existente en las redes sociales, es decir, Twitter, Facebook y canales de noticias, utilizando características de N-gramas. Nuestro conjunto de datos consta de más de 1,00000 instancias de doce (12) tipos diferentes de temas. Se utilizó un famoso clasificador de aprendizaje automático, Random Forest, para clasificar las oraciones. Mostró un 80,

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento