![]() |
![]() |
![]() |
![]() |
Eine im KDD häufig untersuchte Aufgabenstellung ist die Kategorisierung bei der eine Menge von Beispielen oder Tupeln in endlich viele disjunkte Klassen (die hier auch Kategorien genannt werden) eingeteilt wird. Ziel ist es, Regeln zu finden, die für die einzelnen Tupel aufgrund ihrer Eigenschaften vorhersagen, in welche Klasse bzw. Kategorie sie gehören.
4.2.1: Attribute und Kategorien
4.2.2: Trainings- und Testset
4.2.3: Lernenparadigmen
4.2.4: Der ID3 AlgorithmusIm Folgenden sollen verschiedene Bedingungen, unter denen induktive Lernverfahren ablaufen, sowie Vorgehensweisen und Methoden, nach denen sie entwickelt und eingeteilt werden können, beschrieben werden. Als Beispiel wird dabei häufig der ID3 Algorithmus benutzt werden.
4.2.5: Konsistenz
4.2.6: Endlichkeit des ID3 auf konsistenten Trainingssets
4.2.7: Wertebereiche der Attribute
4.2.8: Bewertung
4.2.9:
4.2.10:
4.2.11: Größe und Repräsentativität des Trainingssets
4.2.12:
4.2.13: Overfitting
4.2.14: Nachoptimierung von Bäumen und Algorithmen
4.2.15: Suchstrategien![]() |
![]() |
![]() |
![]() |