archetype | title | author | readings | tldr | outcomes | quizzes | assignments | youtube | fhmedia | challenges | |||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
lecture-cg |
CAL3 |
Carsten Gips (HSBI) |
|
CAL3 ist eine einfache Erweiterung von CAL2 für nicht-disjunkte (überlappende) Klassen. Statt
beim Baumaufbau bei einer Fehlklassifikation sofort zu verzweigen, werden hier zunächst die
im entsprechenden Pfad aufgelaufenen Klassensymbole gezählt. Wenn ausreichend viele davon
gesehen wurden (Schwelle |
|
|
|
|
**Textklassifikation**
Betrachten Sie die folgenden Aussagen:
> * Patient A hat weder Husten noch Fieber und ist gesund.
> * Patient B hat Husten, aber kein Fieber und ist gesund.
> * Patient C hat keinen Husten, aber Fieber. Er ist krank.
> * Patient D hat Husten und kein Fieber und ist krank.
> * Patient E hat Husten und Fieber. Er ist krank.
Aufgaben:
1. Trainieren Sie auf diesem Datensatz einen Klassifikator mit CAL3 ( |
-
Anfangsschritt:
$\alpha^{(0)} = \ast$ (totales Unwissen) -
$n$ -ter Lernschritt: Objekt$v$ mit Klasse$k$ -
Rückweisung (Endknoten mit
$\ast$ ): Ersetze$\ast$ durch Vereinigungsklasse$/k1/$ -
Endknoten mit Vereinigungsklasse:
- Zähler für
$k$ erhöhen, bzw. -
$k$ mit Anzahl$1$ in Vereinigungsklasse einfügen
- Zähler für
Falls nun die Summe aller Klassen am Endknoten größer/gleich
$S_1$ (Statistikschwelle):-
Für genau eine Klasse gilt:
$P(k | \tilde{x}) \ge S_2$ : \newline => Abschluss: Ersetze Vereinigungsklasse durch$k$ (für immer!)\smallskip
-
Für alle Klassen gilt:
$P(k | \tilde{x}) < S_2$ : \newline => Differenzierung: Ersetze Vereinigungsklasse durch neuen Test:$\kappa \gets x_{t+1}(\ast, \ldots, \ast, /k1/, \ast, \ldots, \ast)$ $x_{t+1}$ : nächstes Attribut, auf dem aktuellen Pfad$\tilde{x}$ noch nicht verwendet \newline Symbol$k$ mit Anzahl 1 an Position$i$ wenn$x_{t+1}(v) = i$
-
0 | 0 | A |
0 | 1 | B |
0 | 1 | A |
1 | 0 | B |
1 | 1 | A |
$S_1 = 4, S_2 = 0.7$
[[Tafelbeispiel CAL3]{.bsp}]{.slides}
\bigskip \pause
Ergebnis:
\smallskip
Trainingsfehler:
::: notes Hinweis: Bei nicht überlappenden Klassen erzeugt CAL3 u.U. andere Bäume als CAL2 ... :::
-
Parameter:
-
$S_1$ : Statistikschwelle, problemabhängig wählen -
$S_2$ :$0.5 < S_2 \le 1.0$ - Klassifikationsfehler kleiner als
$1-S_2$ - kleiner Fehler => großer Baum
- großer Fehler => kleiner Baum
-
\smallskip
- Abbruch:
- Alle Trainingsobjekte richtig klassifiziert \newline => Kein Fehler in einem kompletten Durchlauf
- Alle Endknoten mit eindeutigen Klassensymbolen belegt
- Differenzierung nötig, aber alle Merkmale verbraucht
- Lernschrittzahl überschritten
- CAL3: Erweiterung von CAL2 für überlappende Klassen
- Parameter
$S_1$ (Anzahl Objekte bis Entscheidung),$S_2$ (Dominanz?) - Trainingsfehler wg. überlappender Klassen!
- Parameter
::: slides
Unless otherwise noted, this work is licensed under CC BY-SA 4.0. :::