Database Reference
In-Depth Information
mussen also aus G 1 entfernt werden. Damit erhalten
wir nach Bearbeitung des zweiten Trainingsbeispiels die in Abbildung 5.23 darge-
stellte Situation. Der komplette von VS erzeugte Versionenraum nach Bearbeitung
der beiden Trainingsbeispiele wird damit durch die beiden Begrenzungsmengen S 2
und G 2 aufgespannt.
Die Hypothesen
{
h 2 ,h 4 }
5.5
Data Mining und Wissensfindung in Daten
5.5.1
KDD - Knowledge Discovery in Databases
Data Mining und Wissensfindung in Daten (knowledge discovery in databases,
KDD) sind Oberbegriffe fur die Automatisierung der Analyse von Daten. Beide
Bezeichnungen werden fast synonym gebraucht, wobei Data Mining meist auf den
eigentlichen Prozess der Datenanalyse abstellt, wahrend mit Knowledge Discovery
im Allgemeinen der gesamte Vorgang der Wissensfindung gemeint ist, der außer der
Analyse auch noch die Vorbereitung und Bereinigung der Daten und die Interpre-
tation der Resultate umfasst. Knowledge Discovery wird oft auch benutzt fur die
Suche nach komplexen, tiefliegenden Wissensstrukturen z. B. im wissenschaftlichen
Bereich. Wir werden in der Regel den allgemeineren Term Knowledge Discovery
bzw. kurz KDD verwenden.
Data Mining und Knowledge Discovery haben sich seit Beginn der neunziger
Jahre zu einem zentralen Forschungsthema in der Kunstlichen Intelligenz entwickelt
und erfreuen sich eines großen Interesses auf breiter Basis. Dafur gibt es mehrere
Grunde:
Ein Problem bei der Entwicklung wissensbasierter Systeme ist seit jeher die
arbeits- und zeitintensive Phase der Wissensakquisition. Die Erstellung einer
modelladaquaten Wissensbasis erfordert im Allgemeinen die Zusammenarbeit
moglichst mehrerer Experten des behandelten Bereichs mit Systementwick-
lern. Hierbei treten nicht selten Konsistenzprobleme auf. So kombiniert man
gerne Expertenwissen mit Dateninformationen, wobei bei der konventionellen
Datenanalyse letztere zur Konsolidierung des subjektiven Wissens verwendet
werden. Die weitergehende Idee des Knowledge Discovery kann den gesam-
ten Prozess der Wissensakquisition erheblich beschleunigen und verbessern,
indem vorliegende Daten aktiv und grundlich auf substantielles und relevan-
tes Wissen hin uberpruft werden. Die extrahierte Information kann dann den
menschlichen Experten zur Validierung und Erganzung vorgelegt werden.
Immer mehr Vorgange des alltaglichen, wirtschaftlichen und wissenschaftli-
chen Lebens werden automatisiert und digitalisiert. Dabei fallen immense
Mengen von Daten an, die in der Regel nur als passiver Wissensspeicher ge-
nutzt werden. Das darin verborgene implizite Wissen um bereichsspezifische
Zusammenhange macht die Daten zu einem wertvollen “Rohstoff”, zu einer
Quelle wichtiger Informationen, die nur darauf warten, durch entsprechende
Verfahren “zu Tage gefordert” zu werden (daher die Parallele zum Bergbau,
mining ). Eine manuelle Datenanalyse wird wegen der rapide anwachsenden
Search WWH ::




Custom Search