Hardware Reference
In-Depth Information
Tabelle 5.2. Spezielle Gruppen von Befehlen, die in einer Pipeline verarbeitet werden
konnen. Wird fur die jeweilige Pipeline kein expliziter Wert angegeben, so gilt der in der
mittleren Spalte beschriebene Standardwert fur die Latenzzeit
Schlusselwort
Standardwert
Befehlsgruppe
mul0 ... mul8
10
mul j beschreibt Multiplikationen, deren
zweiter Operand kleiner als 2 8 j
ist ( j so
klein wie moglich).
60
ganzzahlige Division mit und ohne Vorzei-
chen
div
1
alle Schiebeoperationen ( SL , SR , SLU und
SRU )
sh
1
die Multiplex-Operation
mux
1
Sideways Addition ( SADD )
sadd
1
Multiplikation Boolescher Matrizen
mor
4
Gleitkommaaddition
fadd
4
Gleitkommamultiplikation
fmul
40
Gleitkommadivision
fdiv
fsqrt
40
Quadratwurzel
fint
4
Runden
fix
2
Wandlung einer Gleitkommazahl in eine
ganze Zahl (mit oder ohne Vorzeichen)
2
Wandlung einer ganzen Zahl in eine Gleit-
kommazahl (mit oder ohne Vorzeichen)
flot
4
Vergleich von Gleitkommazahlen
feps
2. Der Parameter dispatchmax gibt an, wie viele Befehle gleichzeitig dem
Fetch Buffer entnommen und auf Ausfuhrungseinheiten verteilt werden
konnen. Beim Pentium 4 konnen aus dem oben erwahnten Trace Cache
bis zu sechs Befehle pro Takt zugeteilt werden. Der PowerPC 970 schafft
bis zu acht.
3. Der Parameter commitmax gibt an, wie viele Befehle gleichzeitig in einem
Taktzyklus bestatigt werden konnen.
Praktische Werte fur diese Parameter gibt Tabelle 5.3 an, soweit diese Infor-
mationen verfugbar sind.
In einigen Prozessoren wird die Logik zum Uberwachen der Operanden und
Verwalten der Ergebnisse vom Umsortierpuffer naher an die Ausfuhrungs-
einheiten verlagert. So genannte Reservation Stations konnen diese Aufgabe
ubernehmen [17, 19]. Es muss dann dabei nicht fur jede Ausfuhrungseinheit
Search WWH ::




Custom Search