Databases Reference
In-Depth Information
Mining-Methoden und ihre Analysealgorithmen angewendet werden. Dies ermöglicht die
Verwendung von Clusteranalysen, Assoziationsanalysen, Klassifikationsmethoden, Ähnlich-
keitsbestimmungen etc.
3.7
Software für das KDD
Um bei Analysevorhaben die beschriebenen Methoden auf meist große Datensätze anwenden
zu können, ist die Unterstützung durch geeignete Software unerlässlich. In den letzen Jahren
gab es einige große Fortschritte, die sich im Funktionsumfang, als auch in der Anzahl der zur
Verfügung stehenden Produkte wiederspiegelt. Dieser Abschnitt stellt einige Systeme dar und
vergleicht sie anhand von allgemeinen, system- und toolsspezifischen, als auch prozess- und
funktionsspezifischen Kriterien. Dies dient dem Ziel, für das Vorhaben der Datenanalyse die
geeignetste Software zu identifizieren.
Ein Überblick über aktuell verfügbare Software für das Knowledge Discovery in Databases
wurde durch aktuelle Literatur (vgl. Gluchowski et al. (2009) und Witten/Frank (2005, 365-
483) sowie durch im Internet veröffentlichte Umfragen und Übersichten erlangt (vgl.
SourceForge.net (2010) und KDnuggets (2010)). Eine von KDnuggets.com im Mai durchge-
führte Umfrage an der N = 912 Personen teilgenommen haben (Duplikate wurden entfernt)
ergab die in Abbildung 3-17 dargestellte Verteilung. In dieser wird die Nutzung von Data
Mining-Werkzeugen in den letzten 12 Monaten für reale Projekte (nicht zur Anwendungsbe-
urteilung) dargestellt.
Search WWH ::




Custom Search