Information Technology Reference
In-Depth Information
0.0
0.5
1.0
x
Abbildung 21.1: Ein Datensatz mit drei Clustern
21.2 Fuzzy- c -Means-Clustering
Selbst wenn der c -Means-Clustering-Algorithmus die drei Cluster in Abbildung 21.1
korrekt identifiziert, ist nicht klar, welchem Cluster der als Kreuz dargestellte Punkt,
der etwa in der Mitte zwischen den beiden rechten Clustern liegt, zugeordnet wer-
den sollte. Diesen Punkt eindeutig einem der beiden rechten Cluster zuzuordnen,
entspräche nicht der Intuition. Die Idee beim Fuzzy-Clustering besteht darin, anstel-
le einer eindeutigen Zuordnung eines Datenobjektes zu genau einem Cluster Zuge-
hörigkeitsgrade zwischen 0 und 1 zu mehreren Clustern zuzulassen.
Dabei wird die formale Bedingung beim c -Means-Clustering, dass für jedes Da-
tenobjekt x j genau eines der u ij gleich 1 und alle anderen 0 sein müssen, d. h. dass
das Datenobjekt x j genau einem Cluster zugeordnet wird, abgeschwächt in die For-
derung, dass die Summe der u ij für jedes Datenobjekt x j den Wert 1 ergeben muss
und dass alle u ij nicht negativ werden dürfen. u ij wird jetzt als Zugehörigkeitsgrad
des Datenobjektes x j zum Cluster i interpretiert.
Würde man die Zielfunktion (21.1) des c -Means-Clustering-Algorithmus mit die-
ser abgeschwächten Nebenbedingung minimieren, würde sich als Optimum immer
noch eine Lösung ergeben, bei der die Zugehörigkeitsgrade u ij nur die Werte 0
und 1 und keine Zwischenwerte annehmen. Aus diesem Grund wird ein Fuzzifier
m > 1indieZielfunktioneingeführt.ManpotenziertdieZugehörigkeitsgradein
der Zielfunktion noch mit dem Fuzzifier m .Fürdenklassischen c -Means-Clustering-
Search WWH ::




Custom Search