Fundamentals of Big Data Analytics
Fundamentos de analítica de datos masivos
¿Qué es la analítica de datos (masivos)? Se podría definir de manera simple como el descubrimiento de “modelos” de datos para extraer información, sacar conclusiones y tomar decisiones. Un “modelo” puede ser una de las siguientes cosas:
- Un modelo estadístico, el cual es una distribución subyacente de los cuales se extraen los datos.
- El uso de datos como un conjunto de entrenamiento para algoritmos de aprendizaje automático.
- La extracción de las características más prominentes de los datos y el desconocimiento del resto.
- Una síntesis de características
Se debe tener cuidado con las consecuencias de la analítica de datos masivos. En conjuntos grandes de datos aleatorios, las características inusuales ocurren y son el efecto de la naturaleza puramente aleatoria de los datos. Esto se conoce como el principio de Bonferroni.
Recursos
-
Formatopdf
-
Idioma:inglés
-
Tamaño:1016 kb