Databases Reference
In-Depth Information
6.3.1 Beschreibung der Eigenschaften
Die Eigenschaften von Daten lassen sich anhand von sechs Kriterien beschreiben.
Je mehr Kriterien zur Beschreibung genutzt werden, desto genauer kann das Da-
tenfeld beschrieben werden und desto eindeutiger ist seine Identifizierung möglich.
6.3.1.1 Format
Mit dem Format wird ein Datum IT-technisch spezifiziert. Ein Datenfeld kann
alphanumerisch, numerisch, integer, floating point, etc. definiert sein, wobei auch
die Länge eines Feldes ein beschreibendes Merkmal ist.
6.3.1.2 Struktur
Das Kriterium Struktur unterscheidet Daten nach drei grundsätzlichen Kriterien.
Strukturierte Daten sind Daten, zu denen strukturgebende Informationen - Meta-
daten - vorhanden sind, durch die die Daten definiert sind. Diese Metadaten kön-
nen unter anderem Auskunft geben über:
Format des Datums,
Erlaubte Werte für das Datum,
Semantische Bedeutung.
Semistrukturierte Daten sind Daten, die in einzelnen Bestandteilen strukturiert
sein können, in der Gesamtheit jedoch keine spezifische, eindeutige Struktur auf-
weisen. Vielfach entstehen semistrukturierte Daten dort, wo Textfelder in Daten-
banken mit unterschiedlichen strukturierten Daten gefüllt werden. Folgende fikti-
ve Beispiele geben einen Eindruck hierüber.
1.
Textfeld = „Mustermann; Heinz; Musterstadt; 12345; 0123 2312312“
2.
Textfeld = „23451; Rainer Dück; 0123 2561432“
Hierbei kann es durchaus sein, dass beide Einträge in einer Datenbank vorkom-
men, da unterschiedliche Mitarbeiter für die Eingabe verantwortlich sind. Jedes
einzelne Element kann dabei einer Struktur folgen, die Gesamtheit ist in der Struk-
tur jedoch nicht einheitlich.
Aus unstrukturierten Daten ist die Informationsgewinnung stark von der Inter-
pretation durch den Informationsempfänger abhängig. Das heißt nicht, dass uns-
trukturierte Daten nicht auch strukturierte Informationen enthalten können, in der
Regel sind diese allerdings nicht direkt und eindeutig erkennbar. Ein Beispiel für
unstrukturierte Daten sind E-Mails.
6.3.1.3 Inhalt
Das Kriterium Inhalt unterscheidet Daten danach, ob sie den eigentlichen Inhalt
(d.h. Bestandteil der Informationen) beschreiben, also Sachverhalte beinhalten, um
die es tatsächlich geht, oder diese lediglich beschreiben. Wir unterscheiden hier
Search WWH ::




Custom Search