Uno de los principales inconvenientes que se presentan en el análisis y procesamiento de la información, es que en la representación de la información normalmente se encuentra un alto número de muestras, cada una de ellas con cientos de variables, en muchos casos con información irrelevante y ruidosa. Por lo que se hace necesario reducir la cantidad de variables. En este artículo se describe una novedosa técnica de selección de variables, inspirada en métodos estocásticos y diseñados para trabajar con máquinas de soporte vectorial (SVM). Los resultados son demostrados usando un conjunto de datos de aplicaciones alimentarias, específicamente, en la detección de la adulteración del aceite de oliva (más costosa) con aceite de avellana (barata). Para el análisis de las muestras se usó la técnica de espectroscopia RMN-1H (Resonancia magnética nuclear de protones). Los resultados demostraron que es posible reducir el número de variables sin afectar los resultados de clasificación.
Introducción
El uso de características tanto estáticas como dinámicas de la respuesta de la tecnología H-NMR ha dado lugar a una explosión de las variables que pueden introducirse en el reconocimiento de patrones (PARC). Sin embargo, el uso de un elevado número de variables en la entrada de un sistema PARC no garantiza necesariamente un mejor rendimiento. De hecho, el uso de variables ruidosas o irrelevantes en la entrada de un sistema PARC puede poner en peligro su fase de entrenamiento y dar lugar a un menor rendimiento durante la fase de reconocimiento. Por lo tanto, la idea detrás de la selección de variables es deshacerse de las características de respuesta que son redundantes, ruidosas o irrelevantes para las tareas de clasificación/cuantificación previstas, de tal manera que la dimensionalidad de los datos pueda reducirse sin pérdida de información útil. De este modo, el sistema PARC podría entrenarse más rápidamente y tendría una buena generalización. Además, se podría idear una configuración óptima de la información utilizando características relevantes seleccionadas por el algoritmo de selección de variables. Se han descrito diferentes estrategias para la reducción de la dimensionalidad, pero se ha informado muy poco sobre la selección de variables para la información H-NMR. Estas, básicamente, consisten en elegir directamente entre las variables disponibles o en computar nuevas variables llamadas factores (por ejemplo, realizando un análisis de componentes principales o un análisis discriminante lineal, etc.).
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Bacterias patógenas en leche cruda: problema de salud pública e inocuidad alimentaria
Video:
Situación de los transgénicos en Chile y el mundo
Informe, reporte:
Instituto del cacao y del chocolate
Infografía:
Proceso del vino : preparación e inoculación de levaduras y nutrientes
Artículo:
Optimización de los parámetros de proceso para la producción de cerveza de arroz (Oryza sativa L.) en las Filipinas
Libro:
Ergonomía en los sistemas de trabajo
Artículo:
Sistemas de producción y potencial energético de la energía mareomotriz
Artículo:
Obtención de gas combustible mediante la bioconversión del alga marina Ulva lactuca
Artículo:
La necesidad de la planeación estratégica en las organizaciones industriales modernas