Con el rápido desarrollo de la inteligencia artificial en los últimos años, la investigación sobre el procesamiento de imágenes, la minería de textos y la informática del genoma se ha profundizado gradualmente, y la minería de bases de datos a gran escala ha comenzado a recibir cada vez más atención. Los objetos de la minería de datos también se han vuelto más complejos, y las dimensiones de los datos de los objetos mineros son cada vez más altas. En comparación con las dimensiones de datos ultra-elevadas, el número de muestras disponibles para el análisis es demasiado pequeño, lo que da lugar a la producción de datos de muestras pequeñas de alta dimensión. Los datos de pequeñas muestras de alta dimensión provocarán graves desastres dimensionales en el proceso de minería. Mediante la selección de características, se pueden eliminar eficazmente las características redundantes y el ruido en los datos de muestras pequeñas de alta dimensión, evitando los desastres dimensionales y mejorando la eficacia real de los algoritmos de minería. Sin embargo, los métodos de selección de características existentes hacen hincapié en el rendimiento de la clasificación o la agrupación de los resultados de la selección de características e ignoran la estabilidad de los resultados de la selección de características, lo que conducirá a resultados de selección de características inestables, y es difícil obtener características reales y comprensibles. Basándose en el método tradicional de selección de características, este artículo propone un método de selección de características de conjunto, el método de selección de características de Bosque de Bits Aleatorio de Clustering Recursivo (RBF-RCE), combinado con múltiples conjuntos de clasificadores básicos para llevar a cabo un aprendizaje paralelo y filtrar los mejores resultados de clasificación de características, optimiza el rendimiento de clasificación de los métodos tradicionales de selección de características, y también puede mejorar la estabilidad de la selección de características. A continuación, este artículo analiza las razones de la inestabilidad de la selección de características e introduce un método de medición de la estabilidad de la selección de características, la Medición de Intersección (IM), para evaluar si el proceso de selección de características es estable. La eficacia del método propuesto se verifica mediante experimentos en varios grupos de conjuntos de datos de muestras pequeñas de alta dimensión.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Compuestos de celulosa nanofibrilada tratados con glicerina
Artículo:
Propiedades mecánicas del cemento de ionómero de vidrio de alta viscosidad y nanopartículas de carbómero de vidrio
Artículo:
Construcción automática y optimización global de un léxico multisentimental
Artículo:
Control del tamaño de partícula de Y2O3:Eu3 preparado mediante un método Sol-Gel asistido con agua de coco
Artículo:
Restauración atraumática de la impactación vertical de alimentos con un contacto abierto utilizando resina compuesta fluida asistida por alambre de cerclaje bajo tensión