Database Reference
In-Depth Information
6.5.1
Das Indexvokabular
Die Merkmale, die zur Indizierung von Fallen benutzt werden, gehoren zu den Be-
griffen, die auch bei der formalen Fallbeschreibung zum Einsatz kommen ( Deskrip-
toren ). In der Regel ist jedoch die Beschreibung eines Falles sehr viel ausfuhrlicher
als seine Indizierung. Diejenigen Merkmale, die ins Indexvokabular aufgenommen
werden, mussen in besonderer Weise geeignet sein, relevante Kennzeichen eines Fal-
les herauszufiltern, wobei Relevanz hier sowohl im Hinblick auf fachliche Aspekte
als auch auf die Aufgaben des Systems zu sehen ist.
Dabei ist eine zeitliche Diskrepanz zu uberwinden. Falle werden zu dem Zeit-
punkt indiziert, zu dem sie in die Datenbasis aufgenommen werden, aber erst zu
einem spateren Zeitpunkt durch den Suchalgorithmus wieder angesprochen. Damit
muss eine Indizierung die Nutzlichkeit eines Falles fur zukunftige Aufgaben pro-
gnostizieren konnen. Die Schwierigkeit besteht naturlich darin, die volle Bandbreite
moglicher Aufgaben abzudecken. Sinnvoll ist hier eine Betrachtung daruber, zu
welchem Zweck Falle vom System tatsachlich genutzt werden: Sollen sie Losungen
vorschlagen? Sollen sie auf Fehlschlage hinweisen? Werden sie benutzt, um Ergeb-
nisse zu planen? Fur jedes CBR-System sind die Merkmale am wertvollsten, die sich
auf tatsachlich wahrgenommene Aufgaben beziehen. Es ist allerdings offensichtlich,
dass die Festlegung eines vollstandigen Vokabulars, das alle zukunftigen Situatio-
nen abdeckt, unmoglich ist. Statt dessen begnugt man sich mit einem Vokabular,
das adaquat und hinreichend ausdrucksstark ist, und behalt sich die Moglichkeit
spaterer Erweiterungen vor.
Damit unterscheidet sich die Indizierung im Bereich des fallbasierten Schlie-
ßens grundsatzlich von den traditionell in Datenbank- und Information Retrieval-
Systemen verwendeten Ansatzen. Wahrend dort Indizes dazu benutzt werden, eine
Partitionierung der Datenmenge in moglichst gleich große Teile zu garantieren, ist
die Indizierung hier auf einen Zweck hin ausgerichtet.
Im Allgemeinen besteht ein Indexvokabular aus zwei Teilen, namlich aus einer
Menge von Merkmalen oder Attributen und aus Wertemengen , die diesen Attribu-
ten zugeordnet sind. Ein Attribut-Wert-Paar wird auch Deskriptor genannt. Die
Feinkornigkeit der Wertereprasentation hangt dabei ab von dem Maßstab an Ahn-
lichkeit, der an die Falle zum Vergleich angelegt wird.
Da die Schlusselworte bei der Fallselektion auf den beschreibenden Strukturen
der Fachsprache basieren, ist es wichtig, das Indexvokabular darauf abzustimmen.
Daraus ergeben sich folgende Anforderung an Indizierung und Vokabular:
Zum Indizieren sollten Konzepte verwendet werden, die der Terminologie des
zu behandelnden Gebiets folgen.
Das Indexvokabular sollte die Begriffe vorwegnehmen, die bei einer Fallselek-
tion benutzt werden.
Beim Indizieren sollten auch die Umstande einer Fallselektion vorweggenom-
men werden, d.h. der entsprechende Aufgabenkontext.
Außerdem sollten “gute” Indizes auch nach folgenden Gesichtspunkten gewahlt
werden:
Search WWH ::




Custom Search