Databases Reference
In-Depth Information
lich interpretiert. Folglich sind viele der gefundenen Webseiten inhaltlich nicht
relevant. Der Begriff Informationsqualität bezieht sich in diesem Beitrag damit
ausschließlich auf die Relevanz der Suchergebnisse oder anders formuliert auf die
Frage, inwieweit Suchmaschinen dazu in der Lage sind, die aus der Perspektive
des Nutzers relevanten Suchergebnisse als erstes anzuzeigen.
Vor diesem Hintergrund werden in jüngerer Zeit immer häufiger Diskussionen
über das so genannte semantische Web geführt, mit dem man die Vision einer um
semantische Informationen angereicherten Version des vorhandenen World Wide
Web verfolgt. Im semantischen Web soll es für Suchmaschinen möglich sein, Such-
anfragen nicht nur anhand der eingegebenen Zeichenkette zu bearbeiten. Stattdes-
sen würde über die reine Zeichenkette hinaus die inhaltliche Bedeutung der Such-
wörter bei der Bearbeitung einer Suchanfrage berücksichtigt. Im Vergleich zu her-
kömmlichen Suchmaschinen wäre insofern mit einer Verbesserung des Status quo
zu rechnen, d. h. die Informationsqualität der Suchergebnisse könnte sich signifi-
kant verbessern. Bislang konnten sich semantische Suchmaschinen jedoch nicht
etablieren. Vielmehr muss diagnostiziert werden, dass viele Autoren der Vision
des semantischen Webs sehr kritisch gegenüberstehen. Stellenweise werden die in
diesem Kontext diskutierten Ideen als „akademisch“ und „realitätsfern“ deklariert.
In Anbetracht der kontrovers verlaufenden Diskussion soll in diesem Beitrag hin-
terfragt werden, inwieweit semantische Suchdienste zu einer Verbesserung der
Informationsqualität auf den Suchergebnisseiten führen können und welche Vor-
und Nachteile mit ihnen im Vergleich zu den gegenwärtig dominierenden Such-
maschinen einhergehen. Zu diesem Zweck gilt es zunächst die Funktionsweise
und die Problemfelder algorithmenbasierter Suchmaschinen aufzuzeigen. In die-
sem Zusammenhang soll insbesondere geklärt werden, wie algorithmenbasierte
Suchmaschinen (wie z. B. Google oder Yahoo) auf die Qualität von Webseiten und
damit indirekt auf die Informationsqualität schließen. Sodann wendet sich der
Beitrag der Diskussion semantischer Suchmaschinen zu und hinterfragt deren
praktische Relevanz im Allgemeinen und deren Beitrag zur Erhöhung der Infor-
mationsqualität im Speziellen. Ein Fazit schließt den Beitrag ab.
7.2 Charakterisierung algorithmenbasierter Suchmaschinen
7.2.1 Funktionsweise algorithmenbasierter Suchmaschinen
Algorithmenbasierte Suchmaschinen nutzen zur Informationsbeschaffung und
-auswertung Roboterprogramme. Sie analysieren automatisch die im Web auffind-
baren Seiten. Indem sie selbstständig den dort platzierten Hyperlinks folgen, kön-
nen sie in einem vergleichsweise kurzen Zeitraum einen großen Teil des Webs
analysieren und für anschließende Suchanfragen erschließen. Die auf diesen Seiten
vorgefundenen Hyperlinks sowie die dort vorgefundenen Seiteninformationen
werden dazu in einer speziellen Datenbank gespeichert, dem so genannten Index.
Auf ihn greift die Suchmaschine im Zuge einer Suchanfrage zurück und gleicht die
Search WWH ::




Custom Search