Databases Reference
In-Depth Information
semantische Relationen zwischen diesen berechnet werden sowie Ähnlichkeiten zwischen
Begriffen und Dokumenten gefunden werden (Heyer/Quasthoff/Wittig 2006, 6f.). Nutzenstif-
tend können die Verfahren nach Ben-Dov/Feldman (2005, 802) auch sein bezüglich der Ex-
traktion relevanter Informationen aus einem Dokument, der Identifikation von Trends oder
Beziehungen zwischen Personen/Orten/Organisationen, der Klassifikation oder Clustering
von Texten bzgl. ihres Inhalts sowie das Wiederfinden von Dokumenten auf Grundlage von z.
B. Suchtermen.
Um ausgehend von vorliegenden Daten in Textform solche nützlichen Informationen zu gene-
rieren, ist eine Reihe von Bearbeitungs- und Analyseschritten notwendig. Der Text Mining-
Prozess umfasst zwei Schritte, eine linguistische bzw. statistische Vorverarbeitung des Textes
sowie eine Anwendung von Analysealgorithmen. Ein beispielhafter Prozess des Text Mining
wird von Shi/Kong (2009, 4168) vorgestellt. Dieser ist in Abbildung 3-13 dargestellt.
Ein weiterer Prozess der ähnliche Schritte für das Text Mining vorsieht, wird von
Nisbet/Elder/Miner (2009, 184) dargestellt. Begonnen wird mit der Datenauswahl, die in
Form einer Gesamterhebung oder auch als zufällige oder geplante Stichprobe erfolgen kann.
Die Texte werden darauf mit Hilfe verschiedener Textverarbeitungsmethoden wie Stemming,
Lemmatisierung usw. bearbeitet (siehe Kapitel 3.6.3.4). Danach werden in Abhängigkeit vom
Ziel der Datenanalyse Methoden wie die Assoziationsanalyse oder das Clustering angewen-
det, die ein Wissensmodell als Ergebnis haben. Wenn sinnvoll, wird dieses Ergebnis visuali-
siert, anschließend zur Wissensgenerierung evaluiert und zurück an die Stakeholder
gespiegelt.
Search WWH ::




Custom Search