Database Reference
In-Depth Information
Genre als mehrdimensionale Hypercubes
Das letzte Zusatzpaket, das wir uns ansehen wollen, ist cube .Wirnutzenden
Datentyp cube , um die Filmgenres als mehrdimensionalen Vektor abzubil-
den. Dann verwenden wir Methoden, die effizient nach den nächstliegenden
Punkten innerhalb der Grenzen eines Hypercubes suchen, um uns eine Liste
ähnlicher Filme zurückzuliefern.
Ihnen wird aufgefallen sein, dass wir zu Beginn des 3. Tages eine Spalte na-
mens genres vom Typ cube angelegt haben. Jeder Wert ist ein Punkt in einem
18-dimensionalen Raum, in dem jede Dimension ein Genre repräsentiert.
Warum stellt man Filmgenres als Punkte in einem n-dimensionalen Raum
dar? Die Kategorisierung von Filmen ist keine exakte Wissenschaft und vie-
le Filme sind nicht zu 100 Prozent Komödie oder Tragödie, sondern liegen
irgendwo dazwischen.
In unserem System wird jedem Genre ein (völlig willkürlicher) Wert zwischen
0 und 10 zugewiesen, je nachdem, wie stark der Film einem Genre verhaftet
ist. Die 0 steht dabei für gar nicht und 10 für sehr stark.
Star Wars hat den Genre-Vektor (0,7,0,0,0,0,0,0,0,7,0,0,0,0,10,0,0,0) .
Die genres -Tabelle beschreibt die Position jeder Dimension im Vektor. Wir
können den Genre-Wert entschlüsseln, indem wir cube _ ur _ coord(vector,
dimension) für jede genres . position abrufen. Der Klarheit halber filtern wir
Genres mit dem Wert 0 aus.
SELECT name,
cube _ ur _ coord( '(0,7,0,0,0,0,0,0,0,7,0,0,0,0,10,0,0,0)' , position) as score
FROM genres g
WHERE cube _ ur _ coord( '(0,7,0,0,0,0,0,0,0,7,0,0,0,0,10,0,0,0)' , position) > 0;
name | score
-----------+-------
Adventure |
7
Fantasy
|
7
SciFi
|
10
Ähnliche Filme finden wir, indem wir die nächstliegenden Punkte aufspüren.
Um zu verstehen, warum das funktioniert,könnenwirunszweiFilme(wiein
der nachfolgenden Abbildung) als zweidimensionales Genre-Diagramm vor-
stellen. Wenn Sie Ich glaub', mich tritt ein Pferd (Animal House) mögen, werden
Sie sich wohl lieber Jungfrau (40), männlich, sucht . . . (The 40 Year Old Virgin)
als Oedipus ansehen - eine Geschichte, der definitiv jeder Humor fehlt. In un-
serem zweidimensionalen Universummüssen wir nur eine Nearest-Neighbor-
Suche durchführen, um passende Treffer zu finden.
Search WWH ::




Custom Search