Maschinelles Lernen - Methoden Wissensbasierter Systeme

Database Reference

In-Depth Information

nicht notwendig kausaler Natur, und beruhen auf Beobachtungen. Es wird jedoch

unterstellt, dass sich in ihnen implizite strukturelle Abhangigkeiten manifestieren.

Der typische Anwendungsbereich fur Assoziationsregeln ist die Verkaufsdatenana-

lyse, sie konnen jedoch auch z. B. zur Diagnose genutzt werden (im medizinischen

Bereich reprasentieren sie beispielsweise Zusammenhange zwischen Symptomen und

Krankheiten) und kommen allgemein bei der Entscheidungsunterstutzung zur Gel-

tung.

Die (konkreten oder abstrakten) Dinge, deren Beziehungen zueinander be-

schrieben werden sollen, heißen Items .Sei

{

i 1 ,i 2 ,...

}

eine (endliche) Men-

ge solcher Items. Eine beliebige Teilmenge X

⊆I

wird Itemmenge genannt. Eine

k-Itemmenge ist eine Itemmenge mit k Elementen.

Eine Transaktion t

⊆I

ist eine Itemmenge. Die Datenbasis

{

t 1 ,t 2 ,...

}

bestehe aus einer Menge solcher Transaktionen. Der Support einer Itemmenge X

ist der (relative) Anteil aller Transaktionen aus

,dieX enthalten:

support (X)= |{

∈D|

⊆

|D|

Beispiel 5.30 Bei der Verkaufsdatenanalyse eines Supermarktes sind Items typi-

scherweise die Artikel aus dem Sortiment des Marktes, und die Transaktionen ent-

sprechen den dort getatigten Einkaufen von Kunden. Die Datenbasis

besteht

dann aus allen Verkaufstransaktionen innerhalb eines bestimmten Zeitraums. Der

Support der Itemmenge

beispielsweise kann 0.40 betragen, d. h. 40 % aller

Kunden kaufen bei ihrem Einkauf auch Milch ein.

{

Milch

}

Eine Assoziationsregel hat die Form

→

wobei X und Y disjunkte Itemmengen sind mit X, Y

⊆I

und X

∩

Y =

∅

.Man

sagt, eine Transaktion t erfullt eine solche Regel X

→

Y ,wennX

∪

⊆

t,wenn

also t alle in der Regel vorkommenden Items enthalt.

Zwei wichtige einer Assoziationsregel zugeordnete Großen sind Support und

Konfidenz .Der Support von X

→

Y ist der Support der Itemmenge X

∪

Y :

support (X

→

Y )= support (X

∪

Y )

Die Konfidenz von X

Y ist der (relative) Anteil derjenigen X enthaltenden

Transaktionen, die auch Y enthalten:

→

Y )= |{

∈D|

∪

Y )

⊆

confidence (X

→

∈D|

⊆

support (X

Y )

support (X)

→

Support und Konfidenz (s. auch [20]) sind also nichts anderes als (bedingte) relative

Haufigkeiten bzw. (bedingte) Wahrscheinlichkeiten (vgl. Abschnitt A.3 im Anhang).

Methoden Wissensbasierter Systeme

Search WWH ::

Custom Search

Home