Fallbasiertes Schließen - Methoden Wissensbasierter Systeme

Database Reference

In-Depth Information

•

die besten Falle werden auf jeden Fall gefunden, denn immer wird die ganze

Fallbasis durchsucht;

•

die Aufnahme neuer Falle in die Fallbasis ist unproblematisch, sie werden

einfach angehangt.

Ein wesentlicher Nachteil liegt jedoch auf der Hand:

•

Die Suche ist ineffektiv und aufwendig.

Fur große Fallbasen ist eine vollig flache Struktur daher im Allgemeinen indiskuta-

bel.

Um die Vorteile einer seriellen Fallbasis weiterhin zu nutzen und andererseits

die Suche effektiver zu gestalten, greift man haufig zu einer Methode, die im Be-

reichderDatenbankenals invertierte Indizierung (inverted indices) bekannt ist:

Jedes Merkmal, das zum Indexvokabular gehort, verweist auf diejenigen Falle, in

deren Indizes es enthalten ist. Zur Bestimmung der Ahnlichkeit werden nur die Falle

in die engere Auswahl gezogen, die zu den Indizes des neuen Falls gehoren. Durch

Einbringung dieser minimalen Struktur erreicht man in vielen Fallen eine vernunf-

tige Reduzierung des Suchraums. Allerdings hangt der Erfolg dieser Methode von

der Wahl der Index-Merkmale ab: Ist das Indexvokabular zu allgemein, so werden

zu viele Falle rekrutiert; ist es zu speziell, besteht die Gefahr, dass interessante Falle

ausgelassen werden, da sie nicht genau passen. Im Unterschied zur konventionellen

Datenbanksuche geht es in CBR-Systemen nicht um einen vollstandigen Abgleich,

sondern lediglich um einen Teilabgleich (partial matching) - Ahnlichkeit, nicht Iden-

titat, ist gefragt, und dazu ist es oft notwendig, von weniger wichtigen Merkmalen

zu abstrahieren.

Ist die Fallbasis jedoch sehr groß, so wird man es nicht bei dieser seichten

Strukturierung belassen wollen, da sowohl Suche als auch Ahnlichkeitsbestimmung

mit der Vielzahl der Falle uberfordert sind. Statt dessen wird man die Fallbasis

hierarchisch organisieren. Eine Moglichkeit hierzu besteht darin, gemeinsame Merk-

male von Fallen herauszufiltern und entlang dieser Gemeinsamkeiten sukzessive ein

Netzwerk aufzubauen. (Andere Verfahren orientieren sich demgegenuber eher an

den Unterschieden zwischen Fallen, vgl. [119], Kap. 8.)

Damit begegnen wir hier einer ahnlichen Aufgabenstellung wie beim Maschi-

nellen Lernen (vgl. Kapitel 5), und tatsachlich lassen sich die durch Verfahren des

maschinellen Lernens aufgebauten Hierarchien (wie z.B. Merkmalsbaume) zur Orga-

nisation von Fallbasen gut verwenden. Die Idee dazu ist folgende: Falle werden ent-

sprechend ihrer Verwandtschaft in Gruppen zusammengefasst. Gilt es nun, passende

Falle zu einem neuen Fall zu selektieren, so wird die geeignetste dieser Gruppen aus-

gemacht und nur die zugehorigen Falle werden durchsucht. Hierarchien bilden sich,

wenn Gruppen rekursiv in Untergruppen aufgespalten werden. Die inneren Knoten

dieser Hierarchien sind (abstrakte) Merkmale, die alle unter ihnen liegenden Falle

besitzen. Die Blattknoten bestehen aus Fallen oder Mengen ahnlicher Falle.

Die Selektion von Fallen in einer solchen hierarchischen Fallbasis beginnt mit

einer Breitensuche: Der neue Fall wird mit den Knoten auf der hochsten Hierarchie-

stufe verglichen, und der geeignetste dieser Knoten wird ausgewahlt. Handelt es

Methoden Wissensbasierter Systeme

Search WWH ::

Custom Search

Home