Titelblatt des Buchs
Reginald Ferber Information Retrieval
Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web

Position im Angebot Information Retrieval -> Grundlagen und klassische IR-Methoden -> Klassische Information-Retrieval-Verfahren -> Bewertung und Vergleich von IR-Systemen
Stichwörter dieser Seite Vektorraummodell, Ähnlichkeitsschranke, Rangfolge, Schwelle
Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]

1.3.7.3: Precision und Recall

Auf der Definition der Relevanz bauen die beiden am häufigsten verwendeten Evaluierungsmaße auf:

Pfeil als Kennzeichnung einer Unterueberschrift Definition 7: Precision und Recall

Precision gibt also den Anteil der relevanten Dokumente unter den gefundenen Dokumenten an, Recall gibt den Anteil der relevanten Dokumente an, die gefunden wurden. Optimal, nämlich gleich 1 , sind die Werte für Precision und Recall natürlich genau dann, wenn Dq=r-1q({ 1}) gilt, wenn also genau alle relevanten Dokumente als Antwortmenge zurückgeliefert werden.

Die beiden Maße sind in gewisser Weise gegenläufig. Zur Illustration kann man die beiden Extremfälle betrachten: Wenn Dq=D gilt, wenn also alle Dokumente auf die Anfrage hin zurückgeliefert werden, ist der Recall gleich 1 :
R (q,D) :=
 | DMathematisches Zeichen: Durchschnitt r-1q({1} ) | 
Leere Abbildung mit der der Bruchstrich erzeugt wird
 | r-1q ({1})  | 
=
 | r-1q( {1}) | 
Leere Abbildung mit der der Bruchstrich erzeugt wird
 | r-1q({ 1}) | 
=1
(jedenfalls, wenn es überhaupt relevante Dokumente in der Datenbank gibt). Die Precision wird aber sehr schlecht sein. (Jedenfalls, wenn nicht alle Dokumente relevant sind).

Wird umgekehrt nur ein einziges relevantes Dokument drMathematisches Zeichen: Element vonD gefunden, so ist
P (q,D) :=
 | { dr}Mathematisches Zeichen: Durchschnittr-1q ({1})  | 
Leere Abbildung mit der der Bruchstrich erzeugt wird
 | {dr}  | 
=
 | {dr}  | 
Leere Abbildung mit der der Bruchstrich erzeugt wird
 | {dr}  | 
=1
der Recall wird aber sehr schlecht sein (jedenfalls, wenn es mehrere relevante Dokumente in der Datenbank gibt).

In der Regel werden die Antwortmengen aber zwischen diesen beiden Extremen liegen. Dann ergibt sich im Allgemeinen bei einer Verkleinerung der Antwortmenge durch eine spezifischere Anfrage eine bessere Precision, aber ein schlechterer Recall; bei einer Vergrößerung der Antwortmenge durch eine allgemeinere Anfrage ergibt sich ein größerer Recall, aber eine kleinere Precision. Ähnliche Situationen können auftreten, wenn Precision- und Recall-Maße dazu verwendet werden, verschiedene Systeme zu vergleichen. Eindeutige Aussagen darüber, ob ein System besser ist als das andere, können nur gemacht werden, wenn für das eine System sowohl der Precision-Wert als auch der Recall-Wert besser ist als bei dem anderen System. Ist bei einem System z.B. die Precision besser, dafür aber der Recall schlechter, so eignen sich die Systeme zwar eventuell für unterschiedliche Aufgaben, es kann aber nicht allgemein gesagt werden, welches besser ist.

Die Gegenläufigkeit der Maße wird besonders interessant, wenn die Größe der Antwortmenge des Systems durch einen Parameter steuerbar ist, wie dies bei den Vektorraummodellen (siehe Abschnitt 1.3.6 ) der Fall ist. Dort wurden die Antwortmengen durch eine Ähnlichkeitsschranke bestimmt, bzw. es wurden als Antwortmengen Rangfolgen von Dokumenten geliefert. Mit einer solchen Rangfolge kann man nun den Zusammenhang zwischen Precision und Recall darstellen und gegebenenfalls die Schwelle so festlegen, dass die gewünschte Art der Antwortmenge erzielt wird.

Pfeil als Kennzeichnung einer Unterueberschrift Definition 8: Precision-Recall-Diagramm

Anschaulich erhält man ein Precision-Recall-Diagramm, indem man in der Rangfolge der Ergebnismenge von oben beginnend die relevanten und nicht relevanten Dokumente zählt. Jedes Mal, wenn man ein relevantes Dokument findet, berechnet man Recall und Precision als neues Paar in der Folge der Paare des Precision-Recall-Diagramms. Abbildung 39 gibt ein Beispiel dieser Berechnung und Abbildung 40 die zugehörige grafische Darstellung an.

Pfeil als Kennzeichnung einer Unterueberschrift Abbildung 39: Beispiel einer Ergebnisliste und der daraus berechneten Folge von Precision-Recall-Paaren

Pfeil als Kennzeichnung einer Unterueberschrift Abbildung 40: Precision-Recall-Diagramm

Falls die Antwortmenge nicht vollständig geordnet ist, also z.B. beim Vektorraummodell mehrere Dokumente die gleiche Ähnlichkeit zur Anfrage haben, muss darauf geachtet werden, dass die Werte in der Folge nicht durch eine willkürliche Vergabe der Rangplätze beeinflusst werden. Wäre im Beispiel der Abbildung 39 jeder Block eine Gruppe von Dokumenten mit gleicher Ähnlichkeit zur Anfrage, so könnten die Dokumente innerhalb der Blöcke zufällig angeordnet werden. Das würde das Precision-Recall-Diagramm beeinflussen. So könnte das 14. Element der Folge auch
(
14
Leere Abbildung mit der der Bruchstrich erzeugt wird
17
,
14
Leere Abbildung mit der der Bruchstrich erzeugt wird
31
)
oder
(
14
Leere Abbildung mit der der Bruchstrich erzeugt wird
17
,
14
Leere Abbildung mit der der Bruchstrich erzeugt wird
40
)
lauten.

Eine Möglichkeit, das Problem zu lösen, besteht darin, Precision-Recall-Paare nur für die verschiedenen Ähnlichkeitswerte zu berechnen, also für jede Ähnlichkeitsschranke eine eigenständige Auswertung zu machen. Im Beispiel der Abbildung 39 würde sich (für den konstruierten Fall, dass jeder Block eine Ähnlichkeitsstufe darstellt) eine Folge aus 19 Gliedern ergeben, die folgendermaßen anfängt:
(
6
Leere Abbildung mit der der Bruchstrich erzeugt wird
30
,
6
Leere Abbildung mit der der Bruchstrich erzeugt wird
10
),(
11
Leere Abbildung mit der der Bruchstrich erzeugt wird
30
,
11
Leere Abbildung mit der der Bruchstrich erzeugt wird
20
),(
13
Leere Abbildung mit der der Bruchstrich erzeugt wird
30
,
13
Leere Abbildung mit der der Bruchstrich erzeugt wird
30
),(
1 4
Leere Abbildung mit der der Bruchstrich erzeugt wird
30
,
14
Leere Abbildung mit der der Bruchstrich erzeugt wird
40
),(
17
Leere Abbildung mit der der Bruchstrich erzeugt wird
30
,
17
Leere Abbildung mit der der Bruchstrich erzeugt wird
50
)

Vergleicht man die Precision an gleichen Recall-Werten, zeigt sich, dass die erste Art der Berechnung bessere Precision-Werte liefert. Das liegt daran, dass der Precision-Wert in diesem Fall nur für die Dokumente berechnet wird, die in der Ordnung vor dem jeweiligen relevanten Dokument liegen, während bei der Blockberechnung eventuell auch nichtrelevante Dokumente einbezogen werden, die zwischen dem relevanten Dokument und der Blockgrenze liegen.

Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]
Position im Angebot Information Retrieval -> Grundlagen und klassische IR-Methoden -> Klassische Information-Retrieval-Verfahren -> Bewertung und Vergleich von IR-Systemen
Dieser Abschnitt und seine Unterabschnitte
Inhalt Stichwörter in der Reihenfolge ihres AuftretensStichwörter alphabetisch sortiert
1.3.7.3Precision und Recall
Def. 7 Precision und Recall
Def. 8 Precision-Recall-Diagramm
Abb. 39 Beispiel einer Ergebnisliste und der daraus berechneten Folge von Precision-Recall-Paaren
Abb. 40 Precision-Recall-Diagramm
Precision, Präzision, Genauigkeit, Recall, Vollständigkeit, Vektorraummodell, Ähnlichkeitsschranke, Rangfolge, Schwelle, Precision-Recall-Diagramm, Precision-Recall-Diagramm Ähnlichkeitsschranke, Genauigkeit, Präzision, Precision, Precision-Recall-Diagramm, Precision-Recall-Diagramm, Rangfolge, Recall, Schwelle, Vektorraummodell, Vollständigkeit

Diese Seiten sind urheberrechtlich geschützt. Die Verantwortung für die Inhalte und die Rechte der Online-Version liegen beim Autor Reginald Ferber, Münster (Westf). Die Rechte der gedruckten Version beim dpunkt.verlag, Heidelberg. Die Weiterverwendung von Texten oder Abbildungen - auch auszugsweise - ist ohne die schriftliche Zustimmung des Autors Reginald Ferber bzw. des dpunkt.verlags nicht gestattet.

Es wird darauf hingewiesen, dass die verwendeten Soft- und Hardware-Bezeichnungen sowie Markennamen und Produktbezeichnungen der jeweiligen Firmen im Allgemeinen warenzeichen-, marken-, oder patentrechtlichem Schutz unterliegen. Alle Angaben und Programme wurden mit großer Sorgfalt kontrolliert. Trotzdem kann keinerlei Haftung für Schäden irgendwelcher Art übernommen werden, die sich im Zusammenhang mit der Nutzung dieser Seiten ergeben.

Diese HTML-Datei wurde am 27-10-2003 erzeugt.