Information Technology Reference
In-Depth Information
nur für die korrekte, sondern auch für eine idiomatischere Sprachver-
wendung anzeigen. 212
Der nächste Schritt zur Automatisierung des Schreibens besteht in der akt-
iven Unterstützung des menschlichen Schreibprozesses durch den Com-
puter. Schon länger in Gebrauch sind Programme für die automatische Ver-
vollständigung von Zeichenketten, die der Schreiber gerade eingibt. Web-
Browser und E-Mail-Programme aktivieren diese nützliche Funktion, wenn
Internet-Adressen eingetippt werden. Am bekanntesten ist sie wohl wegen
ihrer Integration in die Web-Suchmaschinen von Google ( www.google.de )
und Microsoft Bing ( www.bing.de ) . Noch während man seine Suchwörter
eingibt, werden diese zu den wahrscheinlich gemeinten Wörtern ergänzt.
Dies geschieht bei Google im Suchfeld selbst, bei Bing in einer sich unter
dem Eingabefeld öfnenden Liste. Beide Suchmaschinen nutzen dabei Daten-
banken, in denen die von den Nutzern eingegebenen Suchanfragen
gespeichert und nach Häuigkeit gewichtet werden. Die Anfragen werden
auch in Abhängigkeit von ihrer Aktualität und dem Ort ihrer Eingabe unter-
schiedlich ergänzt. Genau genommen werden auch nicht nur die Wörter ver-
vollständigt, sondern auch mögliche Folgewörter angezeigt. So wird »Johann
Wol« nicht nur zu »Johann Wolfgang«, sondern zu »Johann-Wolfgang Go-
ethe« ergänzt. Auch die Folgewörter gehen aus den gespeicherten Suchan-
fragen hervor, mit denen die eingegebene Wortsequenz abgeglichen und
dabei nach und nach die Menge der möglichen Fortführungen eingegrenzt
wird.
Google hat dieses Schreibprinzip eine Zeitlang sogar als eigenständiges
Produkt vertrieben. Unter der Bezeichnung Scribe handelte es sich dabei
um einen Texteditor, der dem Nutzer direkt an der Schreibmarkierung
Vorschläge für Wortvervollständigungen unterbreitete, die mit einem ein-
fachen Tastendruck übernommen werden konnte. Ein solches System oper-
iert mit Übergangswahrscheinlichkeiten zwischen Wörtern, die durch eine
statistische Analyse von Wortpaaren oder -tripeln (»Bigramme«, »Tri-
gramme«, allgemein: »n-Gramme«) in einem Text gewonnen werden. Wenn
eine Wendung wie »mit Bezug auf« in einem Text häuiger vorkommt, dann
werden die Wortpaare »mit Bezug« und »Bezug auf« mit höheren Wahr-
scheinlichkeiten versehen. Wenn nun das Wort »Bezug« nach »mit« gerade
bis zum zweiten Zeichen geschrieben wurde also »mit Be«, dann können
diese Wahrscheinlichkeiten genutzt werden, um zunächst »Be« an dieser
 
Search WWH ::




Custom Search