El estudio del reconocimiento automático de la personalidad ha ganado atención en la última década gracias a las diversas aplicaciones que se derivan de este campo. El modelo de los cinco grandes (también conocido como OCEAN) constituye un método bien conocido para etiquetar distintos rasgos de la personalidad. Este trabajo considera transliteraciones de grabaciones de vídeo recogidas de YouTube (proporcionadas originalmente por el instituto de investigación Idiap) y puntuaciones generadas automáticamente para los cinco rasgos de personalidad que también se proporcionaron en la base de datos. Las transliteraciones se modelan con dos enfoques diferentes de incrustación de palabras, Word2Vec y GloVe, y se incluyen tres niveles diferentes de análisis: regresión para predecir la puntuación de cada rasgo de personalidad, clasificación binaria entre presencia fuerte vs. débil de cada rasgo, y la clasificación tri-clase según tres niveles diferentes de manifestaciones en cada rasgo (bajo, medio y alto). Según nuestros hallazgos, el enfoque propuesto proporciona resultados similares a otros reportados en el estado del arte. Creemos que es necesario seguir investigando para encontrar mejores resultados. Nuestros resultados, así como otros reportados en la literatura, sugieren que existe un gran vacío en el estudio de los rasgos de personalidad basados en patrones lingüísticos, lo que hace necesario trabajar en la recolección y etiquetado de datos considerando el conocimiento de psicólogos y psicolingüistas expertos.
INTRODUCCIÓN
El análisis de texto y el procesamiento del lenguaje natural se han convertido en una subárea de la inteligencia artificial muy útil, que permite extraer información valiosa del texto y realizar una tarea específica. Algunas aplicaciones de estas áreas incluyen clasificación de páginas web ( Onan, 2015 ), clasificación de documentos de texto ( Onan et al., 2016a ; Onan, 2017a ), clasificación de géneros de texto ( Onan, 2016 ), agrupación de documentos de texto ( Onan, 2017b ) y , más recientemente, modelado de extracción de temas ( Onan, 2019a ) y minería de opiniones ( Onan, 2019b ). De manera similar, una de las tareas más frecuentes en el análisis de texto es la clasificación de sentimientos (Onán y Korukoglu, 2015 ; Onán et al., 2016b ; Onán et al., 2016c ; Onán, 2018 ; Onán, 2020 ). Respecto a los tipos de características más utilizadas en el análisis de texto, encontramos: Bag of Words (BoW) ( Onan y Korukoglu, 2015 ; Korukoglu y Bulut, 2016c), temas latentes obtenidos con Latent Dirichlet Allocation (LDA) ( Onan et al., 2016b ), cinco categorías principales de Linguistic Inquiry and Word Count (LIWC) ( Onan, 2018) y, más recientemente, incrustaciones de palabras como Word2Vec, FastText, GloVe, LDA2vec, DOC2vec y vectores globales ponderados de frecuencia de término: frecuencia de documento inversa (TF-IDF) para representación de palabras (GloVe) (Onan, 2020 ).
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Protección de datos privados mediante el cifrado de miel
Artículo:
Un Algoritmo de Construcción de Fronteras para un Conjunto de Puntos Planar Complejo
Artículo:
Estudio sobre el Control Regional del Flujo Turístico Basado en la Teoría Difusa
Artículo:
Sistema de oficina en red inteligente basado en la computación en nube y el aprendizaje automático
Artículo:
Generalización de los flujos térmicos y de masa para el flujo de un fluido de tipo diferencial con el enfoque de derivada fraccionaria de Caputo-Fabrizio.