Uno de los principales inconvenientes que se presentan en el análisis y procesamiento de la información, es que en la representación de la información normalmente se encuentra un alto número de muestras, cada una de ellas con cientos de variables, en muchos casos con información irrelevante y ruidosa. Por lo que se hace necesario reducir la cantidad de variables. En este artículo se describe una novedosa técnica de selección de variables, inspirada en métodos estocásticos y diseñados para trabajar con máquinas de soporte vectorial (SVM). Los resultados son demostrados usando un conjunto de datos de aplicaciones alimentarias, específicamente, en la detección de la adulteración del aceite de oliva (más costosa) con aceite de avellana (barata). Para el análisis de las muestras se usó la técnica de espectroscopia RMN-1H (Resonancia magnética nuclear de protones). Los resultados demostraron que es posible reducir el número de variables sin afectar los resultados de clasificación.
Introducción
El uso de características tanto estáticas como dinámicas de la respuesta de la tecnología H-NMR ha dado lugar a una explosión de las variables que pueden introducirse en el reconocimiento de patrones (PARC). Sin embargo, el uso de un elevado número de variables en la entrada de un sistema PARC no garantiza necesariamente un mejor rendimiento. De hecho, el uso de variables ruidosas o irrelevantes en la entrada de un sistema PARC puede poner en peligro su fase de entrenamiento y dar lugar a un menor rendimiento durante la fase de reconocimiento. Por lo tanto, la idea detrás de la selección de variables es deshacerse de las características de respuesta que son redundantes, ruidosas o irrelevantes para las tareas de clasificación/cuantificación previstas, de tal manera que la dimensionalidad de los datos pueda reducirse sin pérdida de información útil. De este modo, el sistema PARC podría entrenarse más rápidamente y tendría una buena generalización. Además, se podría idear una configuración óptima de la información utilizando características relevantes seleccionadas por el algoritmo de selección de variables. Se han descrito diferentes estrategias para la reducción de la dimensionalidad, pero se ha informado muy poco sobre la selección de variables para la información H-NMR. Estas, básicamente, consisten en elegir directamente entre las variables disponibles o en computar nuevas variables llamadas factores (por ejemplo, realizando un análisis de componentes principales o un análisis discriminante lineal, etc.).
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Hidrolizados de proteína : procesos y aplicaciones
Infografía:
Residuos biológicos y orgánicos en la industria láctea
Capítulo de libro:
La cadena agroindustrial de cebada, malta, cerveza : propuesta para la renegociación del TLCAN y política de fomento para su reconstrucción
Artículo:
Factores nutricionales que modifican la calidad de la carne de cerdo
Artículo:
Extracción del aceite de la cáscara de Bactris gasipaes HBK usando dióxido de carbono presurizado
Artículo:
Creación de empresas y estrategia : reflexiones desde el enfoque de recursos
Artículo:
La gestión de las relaciones con los clientes como característica de la alta rentabilidad empresarial
Artículo:
Los web services como herramienta generadora de valor en las organizaciones
Artículo:
Configuración de los valores de María, antes y después de la violación, en Satanás de Mario Mendoza