|
Will man beispielsweise Literatur zum Stand der
Forschung im Bereich Retrieval-Systeme für Multimedia-Objekte
mit einem besonderen Schwerpunkt auf der Frage suchen, wie Bilder
behandelt werden, könnte man die Datenbank
INSPEC verwenden. Sie besteht aus Dokumenten, die Artikel und Bücher
beschreiben, indem sie neben bibliografischen Angaben eine
Kurzzusammenfassung
(Abstract oder auch
Referat), eine Einordnung in ein hierarchisches
Klassifikationssystem und
Stichwörter enthalten.
Für andere Fachgebiete und Sprachen gibt es
andere Literaturdatenbanken. Abbildung 1
zeigt
einen Eintrag aus der psychologischen Literaturdatenbank PSYNDEX, die
vom Zentrum für psychologische Information und
Dokumentation (ZPID) an der Uni Trier erstellt und angeboten wird.
In diesem Eintrag wird ein Zeitschriftenartikel beschrieben. Neben detaillierten bibliografischen
Angaben, wie Autoren, Titel, Erscheinungsjahr und Anzahl der Literaturverweise
(Referenzen),
enthält der Eintrag eine ausführliche Beschreibung des Inhalts und
fast zehn verschiedene Felder zur systematischen inhaltlichen Erfassung.
Insgesamt gibt es in PSYNDEX 52 Feldbezeichner, aus denen Beschreibungsformate
zusammengestellt werden können. In Abbildung 1
sind
die ausgeschriebenen Namen der verwendeten Felder in Klammern hinter den Kürzeln
aufgeführt.
Die Suche in solchen Literaturdatenbanken geht folgendermaßen vonstatten:
Auf die Eingabe von (Kombinationen von) Wörtern liefert das
(boolesche) Retrieval-System von INSPEC die Dokumente, die die
Wörter in der angegebenen Form enthalten (Genaueres
siehe Abschnitt 1.3.1
).
Um ein gutes Suchergebnis zu erzielen, sollte man deshalb
zunächst überlegen,
welche
Stichwörter das Problem besonders gut beschreiben. Es
sollten Wörter sein, die
spezifisch für die Fragestellung sind, aber doch
wieder so allgemein, dass man annehmen
kann, dass sie in jedem "wichtigen" Artikel vorkommen.
Eine Anfrage mit den Stichwörtern
Retrieval Systems, Multimedia und
Images könnte z.B. so aussehen:
retrieval systems AND multimedia AND images.
Sie wird vom Retrieval-System so interpretiert:
Suche alle Dokumente, in denen jede der drei Zeichenketten
retrieval systems,
multimedia
und images
mindestens einmal irgendwo im Text vorkommt. Dabei wird nicht zwischen
Groß- und Kleinbuchstaben unterschieden, und das Leerzeichen zwischen
retrieval und systems kann auch ein
anderer "white space" sein
(also z.B. ein Zeilenumbruch, auch in Verbindung mit mehreren Leerzeichen).
Die Suche in der Literaturdatenbank INSPEC lieferte für die
Zeit von Januar bis Juni 1995 drei
Einträge: "Image Engine: an
object-oriented multimedia database for storing, retrieving and sharing
medical images and text",
"Multimedia information
retrieval using knowledge in encyclopedia
texts", "Images database
management system: a `server-client producer' system on a local network
and on the Internet".
Nun sind drei Dokumente nicht gerade viel. Man kann
also versuchen, die Anfrage etwas allgemeiner zu formulieren.
Wenn die folgende Anfrage verwendet wird:
retrieval AND multimedia AND image$,
finden sich immerhin 35
Dokumente für denselben Zeitraum. Dabei ist
$ eine Wildcard,
image$ bezeichnet also alle Wörter, die mit der
Zeichenkette image beginnen. In der
Ergebnisliste finden sich Titel wie: "PhotoFile: a digital
library for image retrieval",
"Spatial knowledge representation and retrieval in 3-D image
databases", "Multimedia retrieval
technology", "A WWW interface to the
OMNIS/Myriad literature retrieval engine",
"Problems of content-based retrieval in image
databases". Sie sehen auf den ersten Blick nicht weniger relevant aus
als die oben genannten. Weitere Verallgemeinerungen der
Anfrage und ihre Treffermengen sind in Abbildung
2
angegeben.
Zu den Titeln aus der Ergebnisliste können noch die
vollständigen bibliografischen Angaben abgerufen werden, ähnlich wie sie
in Abbildung 1
für die psychologische
Datenbank gezeigt wurden. Sie enthalten auch ein Abstract und
Einordnungen in verschiedene Ordnungs- und Beschreibungssysteme. Die
vollständigen Artikel müssen aber auf anderen Wegen, also z.B. aus der Bibliothek,
über die Fernleihe oder durch einen
Lieferdienst, beschafft werden. Neuere Systeme bieten auch die
Möglichkeit, die vollständigen Artikel elektronisch zu
bestellen oder unmittelbar als Volltextdatei zu beziehen. Die Probleme,
die sich dabei ergeben, sind im Allgemeinen eher ökonomischer oder
organisatorischer Natur als technischer.
|