2.3.6: Einfache Regelsysteme
Die Konstruktion eines ID3-Entscheidungsbaums ging
von einer Menge von Attributen aus, die jeweils eine bestimmte
Wertemenge haben. Ein Ast eines Entscheidungsbaums lässt sich in
eine Menge von durch AND verknüpfte Bedingungen an
die Attribute übertragen, die in den Knoten des Asts vorkommen.
Dabei können die gleichen Methoden verwendet werden wie beim booleschen Retrieval.
Zunächst wird wieder
für ein Attribut Ai:D->Ri
und einen Wert
rj Ri
des Attributs
ein Attribut-Wert-Paar oder eine elementare (bzw. atomare)
Bedingung
definiert
,
die durch Teilmengen von D
charakterisiert ist:
(Ai=rj)
:=A-1i({r
j})={
d D | Ai(d)
=rj}
|
Solche elementaren Bedingungen lassen sich zu
zusammengesetzten
Bedingungen
verknüpfen, dabei heißt die
Verknüpfung
(Ai=rk)
(Aj=rl)
:=A-1i({r
k}) A-
1j({rl}
)
|
Konjunktion oder
AND-Verknüpfung und die Verknüpfung
(Ai=rk)
(Aj=rl)
:=A-1i({r
k}) A-
1j({rl}
)
|
Disjunktion oder
OR-Verknüpfung. Schließlich lässt sich noch
das Komplement
einer Bedingung bilden:
(Ai rk)
:= (Ai=rk)
:=D\A-1i({
rk})
|
Aufgrund der Definition über Mengen lassen sich die
Verknüpfungen unmittelbar auf zusammengesetzte Bedingungen
übertragen.
So wird die Menge der Beispiele aus dem ganz links liegenden Blatt im Baum
aus Abbildung 51
durch folgende Bedingungen beschrieben:
(A1=r1)
(A2=r4)
=A-11({r
1}) A-
12({r4}
)
|
Nimmt man weiter an, dass die
Beispiele dieses Blatts des Baums aus der
Kategorie
Kj
sind, kann man diesen Ast in eine
Regel der
Form
IF (A1(
d)=r1)
(A2(d)
=r4) THEN
d Kj
|
bzw.
(A1=r1)
(A2=r4) Kj
|
umwandeln.
Regeln haben die Vorteile, dass
- sie häufig als Repräsentationsform z.B. in
Expertensystemen verwendet werden,
- sie für Menschen verständlich sind,
- jede einzelne für sich allein verwendet werden kann,
- sie sich leicht generalisieren und spezialisieren lassen.
Sie haben den Nachteil, dass viele der Bedingungen, nämlich die
in der Nähe der Wurzel des Entscheidungsbaums, oft gespeichert und
überprüft werden müssen.
Man kann Regeln in Normalformen bringen, die eine automatisierte
Verarbeitung erleichtern.
Die Regeln, die aus einem
Entscheidungsbaum gewonnen werden, der durch einen ID3-Algorithmus erzeugt wurde, haben eine noch
einfachere Form: Sie sind, wie das obige Beispiel,
Konjunktionen von elementaren Bedingungen.
Diese einzelnen elementaren Bedingungen können wegen
der Kommutativität der Durchschnittsbildung beliebig umsortiert
werden.
Allerdings ergeben sich bei einem solchen Vorgehen sehr viele
Regeln, die in vielen Teilen identisch sind: Die Teile des Baums, die
zwei Äste gemeinsam haben, erscheinen auch als gleiche elementare
Bedingungen in den Regeln. Dadurch wird die Anzahl der Regeln
aufgebläht und die Abarbeitung beschränkt sich im Wesentlichen
auf viele Einzelvergleiche. Im Folgenden werde einige Verfahren genannt,
mit denen der Zugriff effizienter gemacht werden kann, ohne dass ein kompletter
Entscheidungsbaum verwendet wird.
Bei der "manuellen" Konstruktion der Listen in den
Beispielen aus den Abbildungen 58
und
59
wurde von den Beispielen und
nicht von einem Entscheidungsbaum ausgegangen. Im Prinzip lassen sich
Regeln aus einer Trainingsmenge auf folgende einfache Weise
gewinnen:
Wie man leicht sieht, kann auch dieser formale Algorithmus als ein Beweis der
Aussage aus Abschnitt 2.3.5.1
verwendet werden, dass zu jeder endlichen konsistenten Trainingsmenge
ein KDD-Verfahren existiert, das einen Algorithmus konstruiert, mit dem die
Elemente der Trainingsmenge richtig kategorisiert werden können.
Im Folgenden 2.3.7
soll ein Verfahren vorgestellt werden, das den
formalen Algorithmus in eine praxistaugliche Form bringt.
|
| Dieser Abschnitt und seine Unterabschnitte |
| Inhalt |
Stichwörter in der Reihenfolge ihres Auftretens | Stichwörter alphabetisch sortiert |
|
Attribut-Wert-Paar, elementare Bedingung, atomare Bedingung, Bedingung, zusammengesetzte
Bedingung, Konjunktion, Disjunktion, Komplement, Regel, konjunktive
Normalform, disjunktive
Normalform, Entscheidungsliste, Regel, decision
list, Kategorie, Ripple-down-Regelmenge, Trainingsmenge, Regel, Top-down, Bottom-up |
atomare Bedingung, Attribut-Wert-Paar, Bedingung, Bottom-up, decision
list, Disjunktion, disjunktive
Normalform, elementare Bedingung, Entscheidungsliste, Kategorie, Komplement, Konjunktion, konjunktive
Normalform, Regel, Regel, Regel, Ripple-down-Regelmenge, Top-down, Trainingsmenge, zusammengesetzte
Bedingung |
|