Database Reference
In-Depth Information
die besten Falle werden auf jeden Fall gefunden, denn immer wird die ganze
Fallbasis durchsucht;
die Aufnahme neuer Falle in die Fallbasis ist unproblematisch, sie werden
einfach angehangt.
Ein wesentlicher Nachteil liegt jedoch auf der Hand:
Die Suche ist ineffektiv und aufwendig.
Fur große Fallbasen ist eine vollig flache Struktur daher im Allgemeinen indiskuta-
bel.
Um die Vorteile einer seriellen Fallbasis weiterhin zu nutzen und andererseits
die Suche effektiver zu gestalten, greift man haufig zu einer Methode, die im Be-
reichderDatenbankenals invertierte Indizierung (inverted indices) bekannt ist:
Jedes Merkmal, das zum Indexvokabular gehort, verweist auf diejenigen Falle, in
deren Indizes es enthalten ist. Zur Bestimmung der Ahnlichkeit werden nur die Falle
in die engere Auswahl gezogen, die zu den Indizes des neuen Falls gehoren. Durch
Einbringung dieser minimalen Struktur erreicht man in vielen Fallen eine vernunf-
tige Reduzierung des Suchraums. Allerdings hangt der Erfolg dieser Methode von
der Wahl der Index-Merkmale ab: Ist das Indexvokabular zu allgemein, so werden
zu viele Falle rekrutiert; ist es zu speziell, besteht die Gefahr, dass interessante Falle
ausgelassen werden, da sie nicht genau passen. Im Unterschied zur konventionellen
Datenbanksuche geht es in CBR-Systemen nicht um einen vollstandigen Abgleich,
sondern lediglich um einen Teilabgleich (partial matching) - Ahnlichkeit, nicht Iden-
titat, ist gefragt, und dazu ist es oft notwendig, von weniger wichtigen Merkmalen
zu abstrahieren.
Ist die Fallbasis jedoch sehr groß, so wird man es nicht bei dieser seichten
Strukturierung belassen wollen, da sowohl Suche als auch Ahnlichkeitsbestimmung
mit der Vielzahl der Falle uberfordert sind. Statt dessen wird man die Fallbasis
hierarchisch organisieren. Eine Moglichkeit hierzu besteht darin, gemeinsame Merk-
male von Fallen herauszufiltern und entlang dieser Gemeinsamkeiten sukzessive ein
Netzwerk aufzubauen. (Andere Verfahren orientieren sich demgegenuber eher an
den Unterschieden zwischen Fallen, vgl. [119], Kap. 8.)
Damit begegnen wir hier einer ahnlichen Aufgabenstellung wie beim Maschi-
nellen Lernen (vgl. Kapitel 5), und tatsachlich lassen sich die durch Verfahren des
maschinellen Lernens aufgebauten Hierarchien (wie z.B. Merkmalsbaume) zur Orga-
nisation von Fallbasen gut verwenden. Die Idee dazu ist folgende: Falle werden ent-
sprechend ihrer Verwandtschaft in Gruppen zusammengefasst. Gilt es nun, passende
Falle zu einem neuen Fall zu selektieren, so wird die geeignetste dieser Gruppen aus-
gemacht und nur die zugehorigen Falle werden durchsucht. Hierarchien bilden sich,
wenn Gruppen rekursiv in Untergruppen aufgespalten werden. Die inneren Knoten
dieser Hierarchien sind (abstrakte) Merkmale, die alle unter ihnen liegenden Falle
besitzen. Die Blattknoten bestehen aus Fallen oder Mengen ahnlicher Falle.
Die Selektion von Fallen in einer solchen hierarchischen Fallbasis beginnt mit
einer Breitensuche: Der neue Fall wird mit den Knoten auf der hochsten Hierarchie-
stufe verglichen, und der geeignetste dieser Knoten wird ausgewahlt. Handelt es
Search WWH ::




Custom Search