Ensemble approximatif
Un ensemble approximatif est une approximation formelle des chips réglé (c., ensemble conventionnel de ) en termes de paire d'ensembles qui donnent au inférieur et au approximation supérieure de de l'ensemble original. L'approximation inférieure et supérieure se place sont les ensembles croquants dans la version standard de la théorie des ensembles approximative (Pawlak 1991), mais dans d'autres variations, les ensembles rapprochants peuvent être les ensembles brouillés aussi bien.
Définitions
Cette section contient une explication du cadre de base de la théorie des ensembles approximative, avec certaines des définitions principales. Un examen de cette matière première peut être trouvé dans les sources telles que Pawlak (1991), Ziarko (1998), Ziarko et Shan (1995), et beaucoup d'autres.
Cadre de système d'information
Laisser est information système (système d'Attribuer-valeur de ), où est non vide ensemble de fini objet (univers) et est non vide fini ensemble de attribut tel que pour chaque . est l'ensemble de valeurs qui attribuent peuvent prendre. Dans les mots, la table de l'information assigne simplement une valeur dans à chaque attribut de chaque objet dans le . Avec n'importe quels il y a un :
La cloison du produits par le est le (ou ) et peuvent être calculé comme suit :
là où
Si , puis et sont imperceptibles par des attributs de . Dans les mots, pour n'importe quel sous-ensemble choisi d'attributs , il y aura des ensembles d'objets qui sont imperceptibles basés sur ces attributs. Ces ensembles indistinguibles d'objets définissent donc une relation de l'indiscernibility d'équivalence ou de , visée comme relation de -indiscernibility.
Exemple : structure de classe d'équivalence
Par exemple, considérer la table suivante de l'information :
Définition d'ensemble approximatif
Laisser le soit un objectif fixé que nous souhaitons représenter using le sous-ensemble d'attribut. C'est-à-dire, nous sommes dits qu'un ensemble arbitraire d'objets comportant une classe simple, et nous souhaitent exprimer cette classe (c., ce sous-ensemble) using les classes d'équivalence induites par le sous-ensemble d'attribut. Généralement ne peut pas être exprimé exactement, parce que l'ensemble peut inclure et exclure les objets qui sont indistinguibles basés sur les attributs .Par exemple, considérer la cible = réglé de , et laisser = de , le plein ensemble de dispositifs disponible. Il être remarquable qu'ensemble peut pas être exprimé exactement parce que dans le objecte le est imperceptible. Ainsi, il n'y a aucune manière de représenter n'importe quel ensemble qui inclut le mais exclut le et le .
Cependant, la cible réglé peut être rapproché par using seulement l'information contenue dans en construisant les approximations de -lower et de -upper avec de :
Abaisser l'approximation et la région positive
La région positive d'approximation ou de de -lower est l'union de toutes les classes d'équivalence dans qui sont contenu par (c., sont les sous-ensembles de) l'ensemble de cible. Dans exemple, , l'union des deux classes d'équivalence dans qui sont contenus dans l'ensemble de cible. L'approximation inférieure est l'ensemble complet d'objets dans le qui peuvent franchement (c., clairement) être classifiés comme appartenant à la cible réglé.
Approximation supérieure et région négative
L'approximation de -upper est l'union de toutes les classes d'équivalence dans qui ont l'intersection non vide avec l'objectif fixé. Dans exemple, , l'union des trois classes d'équivalence dans qui ont l'intersection non vide avec l'objectif fixé. L'approximation supérieure est l'ensemble complet d'objets qui dans le que le ne peut pas franchement (c., clairement) être classifié comme appartenant au complément du . En d'autres termes, l'approximation supérieure est l'ensemble complet d'objets qui sont des membres du probablement de la cible réglé.Le représente donc la région négative , contenant l'ensemble d'objets qui peuvent être certainement éliminés pendant que des membres de l'ensemble de cible.
Région de frontière
La région de frontière de , donnée par le , se compose de ces objets qui ne peuvent ni être ordonnés dedans ni éliminés car des membres de la cible réglé.En résumé, l'approximation inférieure d'un ensemble de cible est une approximation conservatrice du se composant seulement de ces objets qui peuvent franchement être identifiés comme membres de l'ensemble. (Ces objets n'ont aucun " imperceptible ; clones" ; ce qui sont exclus par l'ensemble de cible.) L'approximation supérieure est une approximation libérale du qui inclut tous les objets qui pourraient être des membres de cible réglés. (Quelques objets dans l'approximation supérieure peuvent ne pas être des membres de l'objectif fixé.) De la perspective du , l'approximation inférieure contient les objets qui sont des membres de l'objectif fixé avec certitude (probabilité = 1), alors que l'approximation supérieure contient les objets qui sont des membres de l'objectif fixé avec la probabilité différente de zéro (probabilité > 0).
L'ensemble approximatif
Le composé d'approximation inférieure et supérieure s'appelle un ensemble approximatif . Ainsi, un ensemble approximatif se compose de deux ensembles croquants, on représentant une frontière plus bas de la cible réglé, et on représentant une frontière supérieure de la cible réglé. L'exactitude de la représentation approximative d'ensemble de l'ensemble peut être donnée (Pawlak 1991) par ce qui suit :
C'est-à-dire, l'exactitude de la représentation approximative d'ensemble de , , , est le rapport du nombre d'objets qui peuvent être le franchement placé dans au nombre d'objets qui peuvent être le probablement soient placés dans . Ceci fournit une mesure de la façon dont étroitement l'ensemble approximatif rapproche l'ensemble de cible. Clairement, quand les approximations supérieures et inférieures sont égales (c., région de frontière vide), puis , et l'approximation est parfait. Toutes les fois que l'approximation inférieure est vide, l'exactitude est zéro (indépendamment de la taille de l'approximation supérieure).
Propriétés formelles des ensembles approximatifs
Les propriétés formelles importantes des ensembles et des frontières approximatifs sont données en Pawlak (1991), et les autres sources citées par ce livre.
Definability
Les approximations généralement supérieures et inférieures ne sont pas égales. Dans ces cas-ci nous disons que la cible réglé est le indéfinissable ou le rudement définissable sur l'attribut réglé. Quand les approximations supérieures et inférieures sont égales (c., la frontière est vide), , alors la cible réglé est le définissable sur l'attribut réglé. Nous pouvons distinguer les cas spéciaux suivants de l'undefinability (Pawlak, Wong, et Ziarko 1988) : réglé est le intérieurement définissable si et de . Ceci signifie cela sur l'attribut réglé, là sont des objets de qui nous pouvons être certains appartenons à réglé par cible, mais il y a aucuns objets de que nous pouvons définitivement exclure de l'ensemble .
réglé est le extérieurement définissable si = de et . Ceci signifie cela sur l'attribut réglé, là sont aucuns objets de qui nous pouvons être certains appartenons à réglé par cible, mais là le sont des objets de que nous pouvons définitivement exclure de l'ensemble .
réglé est le totalement non-définissable si = de et de . Ceci signifie cela sur l'attribut réglé, il y a aucuns objets de qui nous pouvons être certains appartenons à réglé par cible, et il y a aucuns objets de que nous pouvons définitivement exclure de l'ensemble . Ainsi, sur l'attribut réglé, nous ne pouvons pas décider si n'importe quel objet est, ou ne sommes pas, un membre de .
Reduct et noyau
Une question intéressante est s'il y a des attributs dans le système d'information (table d'attribuer-valeur) qui sont plus importants pour la connaissance représentée dans la structure de classe d'équivalence que d'autres attributs. Souvent nous nous demandons s'il y a un sous-ensemble d'attributs qui par se peuvent entièrement caractériser la connaissance dans la base de données. Un tel ensemble d'attribut s'appelle un reduct . Formellement (Ziarko et Shan 1995), un reduct est un sous-ensemble de tels que
le = {ROUGES}, c., les classes d'équivalence induites par l'attribut réduit réglé est identique que la structure de classe d'équivalence a induit par le plein attribut réglé.
L'attribut réglé de
est minimal dans le sens ce pour en attribuent le . En d'autres termes, aucun attribut ne peut être enlevé de l'ensemble sans changer les classes d'équivalence.
Un reduct peut être considéré comme un ensemble du de dispositifs suffisant ; suffisamment, c., pour représenter la structure de catégorie. Dans la table d'exemple ci-dessus, le est un reduct. Le système d'information projeté sur juste ces attributs possède la même structure de classe d'équivalence que cela exprimée par le plein attribut réglé :
Attribut réglé est légitime reduct parce que l'élimination de quelconque d'entre ces attributs cause un effondrement de la structure de classe d'équivalence, avec résultat ce .
Le reduct d'un système d'information est le non unique. Il peut y avoir beaucoup de sous-ensembles d'attributs qui préservent la structure de classe d'équivalence (c., la connaissance) exprimée en système d'information. Dans le système d'information d'exemple ci-dessus, un autre reduct est , produisant la même structure de classe d'équivalence que .
L'ensemble d'attributs qui est commun à tous les reducts s'appelle le noyau . Le noyau est l'ensemble d'attributs qui est possédé par chaque reduct légitime, et se compose donc des attributs que le ne peut pas être enlevé du système d'information sans causer l'effondrement de la structure de classe d'équivalence. Le noyau peut être considéré comme ensemble d'attributs nécessaires ; nécessaire, c., pour que la structure de catégorie soit représentée. Dans l'exemple, le seul un tel attribut est . Des n'importe quels des autres attributs peuvent être enlevés en isolation sans endommager la structure de classe d'équivalence, et par conséquent ce sont tout le dispensable. Cependant, enlever le en isolation fait le changement de la structure de classe d'équivalence, et ainsi le est le indispensable de ce système d'information, et par conséquent du noyau.
Il est possible que le noyau soit vide, ainsi il signifie qu'il n'y a aucun attribut indispensable. N'importe quel attribut simple dans le système d'information peut être supprimé sans changer la structure de classe d'équivalence. Dans ces cas-ci, il n'y a aucun essentiel ou attribut nécessaire qui est exigé pour que la structure de classe soit représentée.
Dépendance d'attribut
Un des aspects les plus importants de l'analyse de base de données ou par acquisition de données est la découverte des dépendances d'attribut. C'est-à-dire, nous souhaitons découvrir quelles variables sont fortement liées à quel d'autres variables. Généralement, c'est ces rapports forts qui justifieront l'enquête postérieure, et qui seront utiles finalement dans la modélisation prédictive.
Dans la théorie des ensembles approximative, la notion de la dépendance est définie très simplement. Prenons deux (disjoindre) ensembles d'attributs, placer et placer , et s'enquérir quel degré de dépendance obtient entre eux. Chaque ensemble d'attribut induit (indiscernibility) une structure de classe d'équivalence, les classes d'équivalence induites par indiqué par , et les classes d'équivalence induites par indiqué par .
Laisser = de , où est une classe d'équivalence donnée de la structure de classe d'équivalence induite par l'attribut réglé. Puis, la dépendance de l'attribut réglé sur l'attribut réglé, , est donnée près
C'est-à-dire, pour chaque classe d'équivalence dans , nous ajoutons la taille de son approximation inférieure par les attributs dans , c., le . Cette approximation (comme ci-dessus, parce que ensemble arbitraire ) est le nombre d'objets que sur l'attribut réglé peut être franchement identifié car appartenant à la cible réglé. Supplémentaire à travers toutes les classes d'équivalence dans , le numérateur ci-dessus représente tout le nombre d'objets que - basés sur l'attribut réglé - peut être franchement classé par catégorie selon la classification induite par les attributs . Le rapport de dépendance exprime donc la proportion (dans l'univers entier) de tels objets classables. Le " de ; peut être interprété comme proportion de tels objets dans le système d'information pour lequel il suffit pour savoir les valeurs des attributs dans pour déterminer les valeurs des attributs dans " ; (Ziarko et Shan 1995).
Une autre manière intuitive de considérer la dépendance est de prendre la cloison induite par Q comme classe C de cible, et considère P comme l'attribut nous a placés souhaitent employer le " ; re-construct" ; la classe C. Si P peut complètement reconstruire C, alors Q dépend totalement du P. Si les résultats de P dans les pauvres et peut-être une reconstruction aléatoire de C, alors Q ne dépend pas de P du tout.
Ainsi, cette mesure de dépendance exprime le degré (c., déterministe) de dépendance fonctionnelle de l'attribut réglé sur l'attribut réglé. Elle n'est pas symétrique. La relation de cette notion de dépendance d'attribut (c., entropique) à des notions information-théorétiques plus traditionnelles de la dépendance d'attribut a été discutée dans un certain nombre de sources (par exemple, Pawlak, Wong, et Ziarko 1988 ; Yao et Yao 2002 ; Wong, Ziarko, et le YE 1986).
Extraction de règle
Les représentations de catégorie discutées ci-dessus sont tout le extensional en nature. C'est-à-dire, une catégorie ou une classe complexe est simplement la somme de tous ses membres. Pour représenter une catégorie est alors juste de pouvoir énumérer ou identifier tous les objets appartenant à cette catégorie. Cependant, la représentation extensional de catégorie ont l'utilisation pratique très limitée, parce qu'ils ne fournissent aucune perspicacité pour décider si les objets (jamais-avant-vus) originaux sont des membres de la catégorie. Ce qui est généralement désiré est une description intentionnelle du de la catégorie, une représentation de la catégorie basée sur un ensemble de règles qui décrivent la portée de la catégorie. Le choix de telles règles n'est pas unique, et se trouve là-dedans la question de la polarisation inductive . Voir l'espace de version de et le choix modèle pour plus au sujet de cette issue.
Représentation logique des tables de décision
Ici nous présentons un procédé d'extraction de règle simple basé sur Ziarko et Shan (1995). Plus avancé rugueux-placer la règle-étude que des systèmes peuvent être trouvés dans la littérature sur l'étude approximative de la règle d'association de . D'abord, nous laisser réintroduisent le système d'information d'échantillon de plus tôt :
Extraction des règles
Maintenant, nous souhaitons trouver l'ensemble minimal de à règles conformées (implications logiques qui caractérisent le système (c., qui peut être augmenté dans la forme de DNF). Pour un ensemble de et une décision attribuent le mathcal, ces règles devraient avoir le , ou, défini,
là où le sont des valeurs légitimes des domaines de leurs attributs respectifs. C'est une forme typique des règles d'association de , et le nombre d'articles dans le qui assortissent la condition/antécédent s'appelle le soutien la règle. La méthode pour extraire de telles règles données dedans est de former une matrice de décision de correspondant à chaque valeur individuelle de l'attribut de décision. Officieusement, la matrice de décision de pour la valeur de l'attribut de décision énumère toutes les paires d'attribuer-valeur que le diffèrent entre les objets ayant le et le . Ceci mieux est expliqué par l'exemple (qui évite également beaucoup de notation). Considérer la table ci-dessus, et laisser le soit la variable de décision (c., la variable du côté droit des implications) et laisser le soit les variables de condition (de l'aile gauche de l'implication). Nous notons que le prend deux valeurs différentes, à savoir le . Nous traitons chaque caisse séparément.