|
- Inhalt:
- Allgemeines Modell
- Klassifikation im IR
- Ähnlichkeitssuche
- Vektorraummodell
- Modell
- Gewichtung
- Ähnlichkeiten
- Zwischenergebnis
- Weiterentwicklungen
- Relevance Feedback
- Social Filtering
- Web-Links nutzen
- Assoziative Verfahren
|
| Kombinierte Gewichtsformeln |
| |
Ein Gewicht wi,j für ein Wort
j
im Dokument
i
wird als
Term Frequnecy x Inverted Document Frequency
berechnet:
| wi,j= |
| h(i,j) |
 |
| d(j) |
|
dabei ist
- h(i,j) die Häufigkeit des Worts j im Dokument i und
- d(j) die Dokumenthäufigkeit (Anzahl der Dokumente in denen das Wort
j vorkommt).
|