En esta investigación, se evaluaron ensayos sobre la preservación de árboles de estudiantes de cuarto grado (escuela primaria de Colombia) con Latent Dirichlet Allocation (LDA). El objetivo fue extraer los temas fundamentales, para comprender el comportamiento y la conciencia de los estudiantes hacia el medio ambiente a partir de la escritura creativa. Los resultados computacionales sugieren que las reflexiones del estudiante sobre la preservación del medio ambiente se centran en cinco temas principales en: Enseñar-Aprender a cuidar el medio ambiente, Explorar-descubrir el medio ambiente, Bienestar del medio ambiente, Preocupación por el medio ambiente y Restauración y conservación del entorno. Este análisis de texto por LDA puede complementar el análisis manual de los docentes, evitando el sesgo de veracidad y permitiendo potenciar las estrategias de enseñanza.
1. INTRODUCCIÓN
Cuando los investigadores necesitan analizar una gran cantidad de texto, necesitan herramientas con capacidad para procesar, decodificar e interpretar la información significativa, evitando el sesgo de veracidad y la infoxicación (B. Chen, Chen, & Xing, 2015; Seufert, Guggemos, & Sonderegger, 2019 ). El modelado de temas (TM) es un conjunto de herramientas computacionales basadas en el aprendizaje automático para el análisis y la extracción de temas de textos, audios y vídeos (Blei, Ng, & Jordan, 2002; Chuang, Gupta, Manning, & Heer, 2013), incluyendo aquellos que tienen un gran volumen de información (Letsche & Berry, 1997; Z. Liu, 2013; Röder et al., 2015; Stevens et al., 2012).
Mientras se aplica en el análisis de textos, la MT puede encontrar patrones de aparición de palabras o términos con un peso estadístico adecuado para la conformación de temas consistentes con los textos (Anandarajan et al., 2019; Blei et al., 2003; Ezen-Can & Boyer, s.f.; Landauer et al., 2011; Xun et al., 2017). Básicamente, estas técnicas generan una combinación de términos en forma de vectores y relacionan uno de estos vectores con cada uno de los otros considerando la proximidad estadística de los vectores, determinando la frecuencia de cada vector o la frecuencia de cada término (Blei et al., 2003; Jelodar et al., 2019; Prabhakaran, 2018). Después de generar una matriz, TM examina: (a) qué vector tiene el mayor peso estadístico, (b) qué vector está más cerca de los vectores con mayor peso estadístico, y (c) de esta manera se obtiene un grupo de vectores relacionados con su frecuencia de ocurrencia (Prabhakaran, 2018).
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Extracción de texto de imágenes de documentos históricos mediante la combinación de varias técnicas de umbralización.
Video:
Big data, privacidad y protección de datos (audio español)
Artículo:
Barreras y fuerzas impulsoras de la implementación de la Industria 4.0 en las organizaciones: un estado del arte
Libro:
Gestión tecnológica : de un enfoque tradicional a la inteligencia
Video:
Aprendizaje profundo: una perspectiva global | NPDL en Uruguay | audio español (doblado)
Artículo:
Creación de empresas y estrategia : reflexiones desde el enfoque de recursos
Artículo:
La gestión de las relaciones con los clientes como característica de la alta rentabilidad empresarial
Artículo:
Los web services como herramienta generadora de valor en las organizaciones
Artículo:
Configuración de los valores de María, antes y después de la violación, en Satanás de Mario Mendoza