Los sensores, los satélites, los dispositivos móviles, las redes sociales, el comercio electrónico e Internet, entre otros, nos saturan de datos. El Internet de los objetos, en particular, permite generar cantidades masivas de datos con mayor rapidez. El Internet de los objetos es un término que describe el proceso de conectar ordenadores, dispositivos inteligentes y otros equipos que generan datos a una red y transmitirlos. Como resultado, los datos se producen y se actualizan de forma regular para reflejar los cambios en todas las áreas y actividades. Como consecuencia de este crecimiento exponencial de los datos, se han acuñado un nuevo término y una nueva idea conocidos como big data. Los big data son necesarios para iluminar las relaciones entre las cosas, prever las tendencias futuras y proporcionar más información a los responsables de la toma de decisiones. Sin embargo, el principal problema actual es cómo recopilar y evaluar eficazmente cantidades masivas de datos diversos y complicados. En algunos sectores o aplicaciones, los modelos de aprendizaje automático son los métodos más utilizados para interpretar y analizar los datos y obtener información importante. Por sí solos, los métodos tradicionales de aprendizaje automático son incapaces de manejar con éxito los problemas de grandes datos. Este artículo ofrece una introducción a la arquitectura Spark como plataforma que los métodos de aprendizaje automático pueden utilizar para resolver problemas relacionados con el diseño y la ejecución de sistemas de grandes datos. Este artículo se centra en tres tipos de aprendizaje automático, incluyendo la regresión, la clasificación y el clustering, y cómo pueden aplicarse sobre la plataforma Spark.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículos:
Percepción de objetivos subacuáticos en el espacio local de la EOH
Artículos:
Estudio del rendimiento de los sistemas de estimación del punto de impacto mediante dos tipos de disposición de los sensores acústicos
Artículos:
Filtrado efectivo de resultados de consultas en perfiles de comportamiento de usuario actualizados en minería web.
Artículos:
Optimización de la síntesis verde de nanopartículas de plata a partir de extractos de hojas de pimienta gorda.
Artículos:
Investigación sobre el método de diseño de una pieza de suspensión biónica basada en la estructura del ala de un albatros
Artículos:
Comportamiento del aguacate Hass liofilizado durante la operación de rehidratación
Artículos:
Caracterización estructural de la materia orgánica de tres suelos provenientes del municipio de Aquitania-Boyacá, Colombia
Informes y Reportes:
Técnicas de recuperación de suelos contaminados
Artículos:
Una revisión de la etiopatogenia y características clínicas e histopatológicas del melanoma mucoso oral.