En esta investigación, se evaluaron ensayos sobre la preservación de árboles de estudiantes de cuarto grado (escuela primaria de Colombia) con Latent Dirichlet Allocation (LDA). El objetivo fue extraer los temas fundamentales, para comprender el comportamiento y la conciencia de los estudiantes hacia el medio ambiente a partir de la escritura creativa. Los resultados computacionales sugieren que las reflexiones del estudiante sobre la preservación del medio ambiente se centran en cinco temas principales en: Enseñar-Aprender a cuidar el medio ambiente, Explorar-descubrir el medio ambiente, Bienestar del medio ambiente, Preocupación por el medio ambiente y Restauración y conservación del entorno. Este análisis de texto por LDA puede complementar el análisis manual de los docentes, evitando el sesgo de veracidad y permitiendo potenciar las estrategias de enseñanza.
1. INTRODUCCIÓN
Cuando los investigadores necesitan analizar una gran cantidad de texto, necesitan herramientas con capacidad para procesar, decodificar e interpretar la información significativa, evitando el sesgo de veracidad y la infoxicación (B. Chen, Chen, & Xing, 2015; Seufert, Guggemos, & Sonderegger, 2019 ). El modelado de temas (TM) es un conjunto de herramientas computacionales basadas en el aprendizaje automático para el análisis y la extracción de temas de textos, audios y vídeos (Blei, Ng, & Jordan, 2002; Chuang, Gupta, Manning, & Heer, 2013), incluyendo aquellos que tienen un gran volumen de información (Letsche & Berry, 1997; Z. Liu, 2013; Röder et al., 2015; Stevens et al., 2012).
Mientras se aplica en el análisis de textos, la MT puede encontrar patrones de aparición de palabras o términos con un peso estadístico adecuado para la conformación de temas consistentes con los textos (Anandarajan et al., 2019; Blei et al., 2003; Ezen-Can & Boyer, s.f.; Landauer et al., 2011; Xun et al., 2017). Básicamente, estas técnicas generan una combinación de términos en forma de vectores y relacionan uno de estos vectores con cada uno de los otros considerando la proximidad estadística de los vectores, determinando la frecuencia de cada vector o la frecuencia de cada término (Blei et al., 2003; Jelodar et al., 2019; Prabhakaran, 2018). Después de generar una matriz, TM examina: (a) qué vector tiene el mayor peso estadístico, (b) qué vector está más cerca de los vectores con mayor peso estadístico, y (c) de esta manera se obtiene un grupo de vectores relacionados con su frecuencia de ocurrencia (Prabhakaran, 2018).
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Guía:
Tintorsoft : sistema de gestión y control de producción para empresas de tintorería y acabado textil y de prendas
Artículo:
La metodología ITalent virtual 2.0 en la generación de innovaciones disruptivas
Artículo:
HAUTO : Composición automática de servicios convergentes, basada en la planificación HTN
Artículo:
Un análisis de la Ley de Informática y sus efectos como instrumento de fomento del desarrollo industrial y tecnológico
Video:
Taller industria 4.0: IoT + big data
Libro:
Ergonomía en los sistemas de trabajo
Artículo:
Obtención de gas combustible mediante la bioconversión del alga marina Ulva lactuca
Artículo:
Sistemas de producción y potencial energético de la energía mareomotriz
Artículo:
La necesidad de la planeación estratégica en las organizaciones industriales modernas