Databases Reference
In-Depth Information
Für die Untersuchung wurden folgende Daten herangezogen: die Änderungsantragsnummer,
der Begründungscode sowie die dazugehörige Problembeschreibung. Aus dem Datenbestand
wurde etwas mehr als die Hälfte der verfügbaren Anträge (27.711 Stück) importiert, die aus
einer Entwicklungsperiode von etwas mehr als 2,5 Jahren stammt. Für die Berechnung wurde
der Naïve-Bayes-Wort-Klassifikationsfilter, der auch von vielen SPAM-Filtern genutzt wird,
verwendet. Dieser ordnet jedes Objekt der Klasse zu, zu der es mit der größten Wahrschein-
lichkeit gehört und kann somit zur Beurteilung anderer Klassifikatoren, in diesem Fall zur
Beurteilung der Begründungscodes, verwendet werden. Der modellierte Analyseprozess ist in
Abbildung 5-46 dargestellt.
Abbildung 5-46:
Prozess zur Ermittlung der häufigsten Wörter in Abhängigkeit vom
Begründungscode
(Quelle: Eigene Darstellung)
Der im Operator Validation modellierte Unterprozess ist in Abbildung 5-47 dargestellt.
Abbildung 5-47:
Unterprozess Naïve-Bayes-Wort-Klassifikationsfilter
(Quelle: Eigene Darstellung)
Als Ergebnis erhält man eine tabellarische Aufstellung der häufigsten Wörter pro Klassifika-
tor, in diesem Fall für jeden einzelnen Begründungscode. Hier dargestellt werden in den fol-
Search WWH ::




Custom Search