Metodología para explorar datos abiertos de accidentalidad vial usando Ciencia de Datos: Caso Medellín
Methodology to explore open data of road crashes using Data Science: Case Medellín
La accidentalidad vial es un serio problema de salud pública en el mundo. El estudio de datos abiertos sobre este tema puede estimular decisiones más oportunas e informadas. El objetivo es proponer una metodología para estudiar datos abiertos sobre accidentalidad vial (caso Medellín) usando Ciencia de Datos, considerando desde la planificación del estudio hasta la visualización web. La metodología consta de cuatro macroprocesos: 1. Planificación, 2. Preparación de datos, 3. Análisis automático y 4. Visualización de datos (aplicación web). Estos constan de una o más etapas, desagregadas en 15 subetapas con alcances univariado, bivariado y multivariado. Los macroprocesos 2-4 fueron automatizados en lenguaje R. Como resultado, el analista puede familiarizarse con el tema (descriptivos), explorar relaciones entre variables, localizar sucesos, inducir patrones de agrupación e identificar algunos factores asociados con los eventos de accidentalidad. Todos estos, combinando variables para una segmentación más detallada. El caso de estudio también tiene valor para otros ámbitos, ya que la accidentalidad vial genera mayores efectos en países en desarrollo, lo cual está atrayendo el interés de los investigadores.
INTRODUCCIÓN
Los accidentes viales representan un serio problema de salud pública. La Organización Mundial de la Salud expresa que, en el mundo, más de 1.25 millones de personas fallece cada año en las vías y, además, los accidentes generan un alto costo para las naciones. De hecho, este tema se encuentra en la agenda 2030 para el desarrollo sostenible, buscando reducir tanto el número de muertes como lesionados a causa de accidentes viales a nivel mundial 1.
Hay varias formas de hacerle frente a dicha problemática, entre ellas los programas de educación y respeto por las normas de tránsito y la disposición de la tecnología para el mejoramiento preventivo. Esto último comprende la mejora de los vehículos, pero también, el aprovechamiento de los abundantes conjuntos de datos que diariamente producen los ecosistemas de transporte, a fin de estimular decisiones más oportunas e informadas.
La alternativa basada en datos viene en auge, a causa de la era de ciudades digitales, Big Data, etc., que provee cada vez más datos abiertos disponibles, y Colombia no es la excepción, tal como lo promueve el Ministerio de Tecnologías de la Información y las Comunicaciones (MINTIC), en función del desarrollo y/o la adaptación de soluciones basadas en datos en variedad de sectores económicos 2.
Recursos
-
Formatopdf
-
Idioma:español
-
Tamaño:2363 kb