Consultas con agrupamiento basado en similitud
Queries with grouping based on similarity
Los conjuntos difusos permiten representar conceptos vagos donde la pertenencia de un objeto puede ser gradual. Se ha propuesto el uso de esta teoría en bases de datos. Como resultado ha surgido el modelo relacional difuso GEFRED, el modelo entidad relación extendido difuso FuzzyEER y lenguaje de consultas difusas FSQL, entre otros. Estas extensiones incluyen algunas formas de atributos difusos, como los llamados Tipo 3. Estos atributos toman valores de un conjunto de etiquetas provisto de una relación difusa de similitud, que es una extensión de las relaciones de equivalencia en la teoría de conjuntos difusos. Las implicaciones de tal tipo de atributos en operadores de consulta particionadas no han sido previamente exploradas. La contribución del presente artículo consiste en la definición sintáctica y semántica de una extensión a SQL para permitir consultas particionadas difusas basadas en atributos Tipo 3. Esta extensión aumenta la expresividad del lenguaje de bases de datos, respecto de propuestas anteriores.
INTRODUCCIÓN
Las bases de datos tradicionales solo manejan datos y condiciones precisos que en muchas ocasiones no representan las necesidades reales de información de los usuarios. La teoría de conjuntos difusos [30] provee un marco matemático y computacional formal para representar las nociones de naturaleza vaga o imprecisa. La incorporación de algunos de estos conceptos para el modelado y manipulación de bases de datos dio origen a propuestas de modelo relacional difuso [5, 9]. Estas fueron luego generalizadas en GEFRED [19], un modelo extendido para bases de datos relacionales difusas.
A partir de este se extendió el modelo Entidad Relación y el lenguaje SQL, surgiendo FuzzyEER [10] y FSQL [10].
Para representar datos difusos FuzzyEER [10] define cuatro tipos de atributos difusos: Tipo 1, atributos con valores de datos precisos provistos con etiquetas lingüísticas, interpretadas como números difusos, con el propósito de ser usadas en condiciones difusas; Tipo 2, atributos que admiten como valores números difusos, son distribuciones de posibilidad en un dominio ordenado; Tipo 3, atributos con valores en un dominio formado por etiquetas provisto de una relación de similitud entre ellas, adicionalmente puede permitir distribuciones de posibilidad; y Tipo 4, similar a los Tipo 3, sin relaciones de similitud. Estos tipos de atributos se encuentran en FSQL [10], solo que con algunas limitaciones impuestas por la representación relacional definida por los autores para el almacenamiento de estos atributos, llamada FIRST-2 [10].
El lenguaje estándar para bases de datos SQL provee constructores que permiten hacer consultas basadas en el ordenamiento y/o en el particionamiento de las relaciones según los valores de atributos específicos. Si se permiten atributos difusos como los propuestos en FuzzyEER, tales constructores de consulta deben extenderse de forma que provean una semántica adecuada en presencia de datos difusos.
Recursos
-
Formatopdf
-
Idioma:español
-
Tamaño:153 kb