Database Reference
In-Depth Information
Tritt einer dieser beiden Falle fur eine Hypothese in den Begrenzungsmengen S oder
G auf, gehen wir fur jede Hypothese s
S und jede Hypothese g
G wie folgt vor:
1. e ist fur s falschlicherweise positiv: Das bedeutet, dass s zu allgemein ist.
Da S aber nur speziellste Hypothesen enthalt, konnen wir s nicht weiter spe-
zialisieren, ohne die Vollstandigkeit zu verlieren. s muss also aus S entfernt
werden.
2. e ist fur s falschlicherweise negativ: Das bedeutet, dass s zu speziell ist und
soweit verallgemeinert werden muss, dass e mit abgedeckt wird.
3. e ist fur g falschlicherweise positiv: Das bedeutet, dass g zu allgemein ist und
soweit spezialisiert werden muss, dass e nicht mehr mit abgedeckt wird.
4. e ist fur g falschlicherweise negativ: Das bedeutet, dass g zu speziell ist. Da
G aber nur allgemeinste Hypothesen enthalt, konnen wir g nicht weiter ver-
allgemeinern, ohne die Korrektheit zu verlieren. g muss also aus G entfernt
werden.
In Abbildung 5.13 ist der vollstandige Algorithmus VS fur das Versionenraum-
Lernverfahren angegeben, der insbesondere diese vier Punkte realisiert. Im nachsten
Abschnitt werden wir VS anhand eines ausfuhrlichen Beispiels erlautern.
Beachten Sie, dass das Ersetzen einer Hypothese s
S durch eine Menge von
minimalen Verallgemeinerungen immer so erfolgt, dass jede neue Hypothese h in
S immer noch spezieller oder gleich einer Hypothese aus G ist; entsprechendes gilt
umgekehrt auch fur G.
Selbsttestaufgabe 5.25 (VS und Begrenzungsmengen) Begrunden Sie,
warum im Algorithmus VS nach der Bearbeitung eines Beispiels wieder gilt, dass
es zu jeder Hypothese s ∈ S ein g s ∈ G mit s ≤ g s und zu jeder Hypothese
g
g gibt. Formulieren Sie dazu eine Invariante Inv (S, G)
und zeigen Sie, dass Inv (S post ,G post )aus Inv (S pre ,G pre ) folgt, wenn S pre , G pre
die Begrenzungsmengen vor und S post , G post die Begrenzungsmengen nach der
Bearbeitung eines Beispiels e sind. Gilt auch Inv (S init ,G init ), wenn S init , G init die
Begrenzungsmengen sind, die sich bei der Initialisierung in VS ergeben?
G ein s g
S mit s g
Die Terminierung von VS ist sichergestellt. Wenn VS terminiert, liegt eine der
folgenden drei Situationen vor:
1. S ist leer und/oder G ist leer. In diesem Fall ist der Versionenraum ebenfalls
zur leeren Menge kollabiert. Das bedeutet, dass es keine konsistente Hypothese
fur die Trainingsbeispiele in dem vorgegebenen Hypothesenraum L C gibt.
2. S und G sind identische einelementige Mengen: S = G =
. Das bedeutet,
dass die Hypothese h das einzige Konzept aus L C ist, das konsistent bzgl. der
Trainingsmenge ist.
{
h
}
3. Alle Beispiele sind bearbeitet, S und G sind beide nicht leer und enthalten
unterschiedliche Hypothesen. In diesem Fall sind alle in dem durch S und G
bestimmten Versionenraum liegenden Hypothesen konsistent bzgl. der Trai-
ningsmenge.
Search WWH ::




Custom Search