Databases Reference
In-Depth Information
Für große Integrations- und Systemtests steht man vor der Her-
ausforderung, eine Datenbank mit allen Vertretern der Äqui-
valenzklassen nutzen zu können, die weiterhin möglichst rea-
listisch die im Betrieb genutzte Datenbank abbildet. Hier ist es
oft der Fall, dass die manuelle Erzeugung von Testdaten enorm
aufwändig werden kann und man gerade bei sehr großen,
schon lange laufenden Datenbanken, nach alternativen Lösun-
gen suchen muss.
Ein in der Praxis häufiger vertretener Ansatz ist es, einfach eine
Kopie der realen Datenbank zu nutzen. Der zentrale Vorteil des
Ansatzes ist es, dass man genau betrachten kann, wie sich die
neu entwickelte Software in der Realität verhält. Fachlich ist der
Ansatz nur eingeschränkt nutzbar, wenn die neue Software-
Funktionalität auch zu neuen Tabellen oder Spalten in Tabellen
führt, die dann zumindest mit sinnvollen Testdaten aufgefüllt
werden müssen.
Häufig kann eine Kopie der realen Daten nicht genutzt werden,
da dies gegen den Datenschutz verstößt, da personenbezogene
Daten Teil der Datenbank sind. In diesem Fall ist das Vorgehen
grundsätzlich mit dem Datenschutzbeauftragten des Unter-
nehmens zu klären. Wenn die Entwicklung der Software nicht
im gleichen Unternehmen wie die Nutzung der Software statt-
findet, ist die Weitergabe persönlicher Daten grundsätzlich
nicht machbar. Weiterhin kann die Weitergabe realer Daten
auch beinhalten, dass Geschäftsgeheimnisse z.B. über genutzte
Geschäftsmodelle sichtbar werden, was in der Regel ebenfalls
verhindert werden muss.
Ein teilweise genutzter Ansatz ist die Auswahl einer Teilmenge
der Datensätze, die dann aber mit allen ihren Abhängigkeiten
extrahiert werden müssen, bei denen Daten zusätzlich anony-
misiert werden. Diese Anonymisierung ist wieder mit dem Da-
tenschutz zu prüfen, da z.B. eine einfache Ersetzung eines Na-
mens nicht ausreicht, solange die Adresse nicht mitgeändert
wird. Generell reichen oft wenige Eigenschaften aus, um Men-
schen eindeutig zu identifizieren; diese Möglichkeit ist für die
Testdaten zu verhindern.
Eine Anonymisierung durch die zusätzliche Änderung der Ad-
resse kann dann aber zu neuen Problemen führen, wenn z.B.
Versicherungstarife von Adressbereichen abhängen, sodass
zumindest realistische Adressen bei der Anonymisierung ge-
nutzt werden müssen.
Ansätze zur
Testdatenge-
winnung
Datenschutz
Anonymisierung
323
Search WWH ::




Custom Search