Database Reference
In-Depth Information
Mit SPIRIT wurden verschiedene reale Problemstellungen behandelt, u.a. Ta-
rifklassifikationen im Versicherungswesen und das in Abschnitt 13.7.2 vorgestellte
Blue Babies-Diagnose-Beispiel [155], außerdem Bonitatsprufungen bei Bankkunden
[126]. Eine Anwendung aus dem psychosozialen Bereich [156] wird in Abschnitt
13.7.3 ausfuhrlich vorgestellt.
Eine weitere auf dem entropie-maximalen Prinzip basierende System-Shell ist
PIT [71], auf der das medizinische Diagnose-System LEXMED [71, 206, 205] basiert.
LEXMED wird zur Zeit in einem deutschen Krankenhaus zur Unterstutzung der
Appendizitis-Diagnose eingesetzt.
Das Prinzip der maximalen Entropie und das allgemeinere Prinzip der mi-
nimalen relativen Entropie (siehe Anhang A.8) stellen ein machtiges Konzept in
der Informations- und Wissensverarbeitung dar. Verschiedene Charakterisierungen
machen die grundlegenden Inferenzstrukturen dieser Methodik transparent (siehe
[210, 173, 111]). In [112, 113] wird die Bedeutung der ME -Prinzipien im allgemeinen
Rahmen des unsicheren Schließens hervorgehoben. Ferner wird in [113] ein Verfahren
fur die Berechnung einer Regelmenge zur entropie-optimalen Reprasentation einer
Verteilung vorgestellt; damit lassen sich geeignete Regelbasen fur ME -Systeme aus
Daten gewinnen.
13.7
Weitere Anwendungen
13.7.1
Proteinklassifikation mittels Hidden Markov Models (HMM)
Die so genannte Primarstruktur eines Proteins ist eine sequentielle Folge von Ami-
nosauren, die seine raumliche 3D-Struktur ( 3D-Fold ) bestimmen. Teile dieser 3D-
Struktur sind fur die im Organismus zu erfullende Aufgabe des Proteins verantwort-
lich. Ahnliche Sequenzen haben auch ahnliche 3D-Folds (das Umgekehrte gilt nicht
immer), so dass eine Sequenzahnlichkeit auch eine ahnliche biologische Funktion
der Proteine vermuten lasst.
Die Ahnlichkeit von Proteinsequenzen spielt also eine zentrale Rolle bei der
Klassifikation von Proteinen, wobei Ahnlichkeit durch einen entsprechenden Score
bestimmt wird. Ein Problem liegt nun darin, dass Proteine einer Familie (z. B. der
Globine) in einigen Bereichen ihrer Sequenz starke Ubereinstimmungen aufweisen,
wahrend die Aminosauren in anderen Teilen sehr variieren konnen.
Abbildung 13.16 zeigt Ausschnitte aus Proteinsequenzen. Eine solche Auflis-
tung mehrerer Proteinsequenzen mit einander zugeordneten Positionen nennt man
multiple alignment . Allgemein versteht man unter einem alignment in der moleku-
laren Biologie die Abbildung einer Sequenz auf eine andere oder auf ein Modell.
Es gibt eine Vielzahl moglicher alignments , wobei die Optimalitat der jeweiligen
Zuordnung durch die Scoring-Parameter bestimmt wird.
Im mittleren Bereich der Tabelle in Abbildung 13.16 befinden sich die weniger
sequenzkonservierten Bereiche der Sequenzen; hier sind die Aminosauren mit klei-
nen Buchstaben gekennzeichnet. Man erkennt hier deutlich starkere Variationen in
Search WWH ::




Custom Search