Biblioteca122.294 documentos en línea

Artículo

Unbiased Feature Selection in Learning Random Forests for High-Dimensional DataSelección imparcial de características en el aprendizaje de bosques aleatorios para datos de alta dimensionalidad

Resumen

Los bosques aleatorios (RFs) han sido ampliamente utilizados como un poderoso método de clasificación. Sin embargo, con la aleatorización tanto en las muestras de embolsado como en la selección de características, los árboles en el bosque tienden a seleccionar características no informativas para la división de nodos. Esto hace que los RFs tengan una baja precisión al trabajar con datos de alta dimensión. Además de eso, los RFs tienen sesgo en el proceso de selección de características donde se favorecen las características multivaluadas. Con el objetivo de des sesgar la selección de características en los RFs, proponemos un nuevo algoritmo de RF, llamado xRF, para seleccionar buenas características en el aprendizaje de RFs para datos de alta dimensión. Primero eliminamos las características no informativas usando una evaluación de p-valor, y el subconjunto de características no sesgadas se selecciona luego en base a algunas medidas estadísticas. Este subconjunto de características se divide en dos subconjuntos. Se utiliza una técnica de muestreo de ponderación de características para muest

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento