La predicción en grandes conjuntos de datos es una tarea común pero complicada, que no puede ser ejecutada utilizando la conocida regresión lineal paramétrica. Sin embargo, los métodos no paramétricos y semiparamétricos, que permiten la predicción construyendo modelos de datos no lineales, son intensivos computacionalmente y carecen de la escalabilidad suficiente para hacer frente a grandes conjuntos de datos y extraer resultados exitosos en un tiempo razonable. Presentamos versiones distribuidas y paralelas de algunos modelos de regresión no paramétricos y semiparamétricos. Utilizamos el paradigma MapReduce y describimos los algoritmos en términos de las estructuras de datos de SPARK para paralelizar los cálculos. La precisión de la predicción de los algoritmos propuestos se compara con el modelo de regresión lineal, que es el único modelo de predicción que actualmente tiene una realización distribuida paralela dentro del marco de SPARK para abordar problemas de big data. También se proporcionan las ventajas de
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Descubrimiento de patrones característicos a partir de transacciones con sus clases.
Artículo:
Extracción adaptativa de características morfológicas y clasificación regresiva de vectores de soporte para el diagnóstico de fallos de rodamientos
Artículo:
Pérdidas aerodinámicas en turbinas con y sin refrigeración por película, según la influencia de la turbulencia principal, la rugosidad de la superficie, la forma del perfil aerodinámico y el número de Mach
Artículo:
Predicciones de empuje y par en aguas abiertas de un sistema de hélice en conducto con un método de paneles
Artículo:
Un método eficaz de diagnóstico de fallos en engranajes basado en la descomposición de valores singulares y la transformada Wavelet de rebanadas de frecuencia