Biblioteca122.294 documentos en línea

Artículo

Optimal Proxy Selection for Socioeconomic Status Inference on TwitterSelección óptima de proxy para la inferencia del estatus socioeconómico en Twitter

Resumen

La inferencia del estatus socioeconómico individual a partir de rastros en línea es una tarea notablemente difícil. Mientras que los métodos actuales comúnmente entrenan modelos predictivos con datos incompletos al agregar información socioeconómica de áreas residenciales o perfiles ocupacionales profesionales, se ha prestado poca atención a qué tan bien esta información sirve como un proxy para el rasgo demográfico individual de interés cuando se alimenta a un modelo de aprendizaje. Aquí abordamos esta pregunta proponiendo tres métodos diferentes de recolección y combinación de datos para primero estimar e inferir el estatus socioeconómico de usuarios franceses de Twitter a partir de su semántica en línea. Evaluamos la validez de cada medida proxy analizando el rendimiento de nuestro sistema de predicción cuando se entrena con estos conjuntos de datos. A pesar de tener que depender de diferentes conjuntos de usuarios, encontramos que entrenar nuestro modelo con la ocupación profesional proporciona un mejor rendimiento predictivo que los datos abiertos del censo o la anotación de entornos habituales a distancia por expert

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento