Determinación de las variables pertinentes para la categorización de los lotes de producción en niveles de calidad
Identifying relevant variables for production batch categorization into quality levels
En los entornos industriales suele encontrarse un gran número de variables de proceso correlacionadas, lo que dificulta a los ingenieros la identificación de las variables clave. Los mínimos cuadrados parciales (PLS) se han aplicado con éxito para seleccionar las variables de proceso más relevantes para predecir las variables de respuesta. Sin embargo, muchas aplicaciones prácticas están más interesadas en clasificar correctamente el producto final en clases. Este trabajo aborda este problema de clasificación mediante la integración de la regresión de mínimos cuadrados parciales (PLS) con la regla del vecino más cercano z y la máquina de vectores de soporte para la categorización de lotes de producción en dos niveles de calidad. Se desarrollan índices basados en parámetros PLS para evaluar la importancia de las variables. A continuación, se aplican los métodos de clasificación para reducir las variables ruidosas e irrelevantes basándose en los índices de importancia. El mejor subconjunto de variables se identifica controlando las variaciones del perfil de precisión mientras se eliminan variables. En tres conjuntos de datos, el enfoque propuesto redujo el número de variables necesarias para la clasificación de lotes de producción en un 90,6%, al tiempo que se obtenían clasificaciones un 29,2% más precisas.
1. INTRODUCCIÓN
El problema de la selección de variables se ha estudiado en varios ámbitos por diferentes razones. Las áreas de matemáticas y estadística se han centrado en la identificación de un subconjunto de variables x que conduzcan a la mejor predicción de la variable de respuesta y, en el contexto de la regresión lineal. Para ello se han aplicado regresiones Stepwise, Backward y Forward, además de técnicas bayesianas (PHILIPHS; GUTTMAN, 1998; GEORGE, 2000; MEROLA; ABRAHAM, 2001).
En ambientes industriales, el control del proceso productivo involucra un gran número de variables, como temperaturas, presiones y concentraciones de reactivos, entre otras. El creciente uso de sensores, junto con el aumento de los recursos computacionales para el almacenamiento de datos, ha dado lugar a escenarios complejos en términos de manejo y análisis de estos datos (KETTANEH et al., 2005). Así, la identificación de las variables más relevantes del proceso es un tema de fundamental importancia para el monitoreo de los parámetros del proceso productivo, además de ofrecer condiciones para la correcta caracterización de los productos de acuerdo con las especificaciones deseadas.
La selección de variables en los procesos industriales puede justificarse por los siguientes aspectos (i) un modelo compuesto por un elevado número de variables puede presentar una adherencia satisfactoria a los datos modelizados, pero no ofrece garantías en términos de predicción (debido al excesivo número de variables independientes en el modelo sobreajustado) y clasificación (debido al ruido insertado por variables menos relevantes) (GUYSON; ELISSEEFF, 2003); (ii) la identificación de variables basada en el conocimiento empírico de expertos suele estar sujeta a equívocos; y (iii) la preferencia por modelos reducidos, ya que requieren menos tiempo de análisis y son menos complejos.
Recursos
-
Formatopdf
-
Idioma:portugues
-
Tamaño:399 kb