8. Első generációs (keskeny) szuperskalár processzorok Flashcards

1
Q

Szuperskalárok közös jellemzői

A

 Kibocsátási párhuzamosság: a CPU a dekódoló
egységből képes órajelciklusonként több
utasítást kibocsátani (max. 2-6 utasítás /
órajelciklus [kibocsátási ráta]). Vagyis ez már
nem csak időbeli, hanem térbeli
párhuzamosság is. (’90-től)
 Utasításablak használata
 Függőségkezelés (extra HW)
 Evolúciós fejlődési stratégia követése > a korábbi CPU-kra írt utasításokat ezen us le lehetett futtatni.
kép17

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Kibocsátás

A

 RISC: max. 3 utasítás / órajelciklus
 CISC: max. 2 utasítás / órajelciklus
o 1 db. CISC utasítás = 1-3 db. RISC utasítás

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Utasítás ablak

A

Ez egy része az első és második generációs szuperskalároknak is.
Lényege: olyan puffer, amely az adott ciklusban kibocsátandó
utasításokat tartalmazza. Itt történik a dekódolás és a
függőségek ellenőrzése is. Ha független egy utasítás, akkor az
egy szabad VE-hez kerül tovább.
kép18

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Utasítás ablak működési alternatívák

A

 Az utasítás ablak feltöltése történhet:
o utasításonként
o egyszerre az összes, amikor kiürült a teljes utasítás ablak
 Utasítások feldolgozása történhet:
o sorrendben
o sorrenden kívül

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Utasítás ablak első generációs szuperskalároknál

A

Egyszerre való feltöltés, sorrendben történő feldolgozás

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Harvard architektúra lényege

A

A programkód és az adatok fizikailag elkülönített útvonalon mozognak és külön tárolódnak.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Harvard architektúra jellemzők

A

 Párhuzamos adatutak vannak, amelyek teljesítménynövekedést eredményeznek
 Párhuzamos végrehajtás szempontjából kedvező kialakítás
 Képes programot adatként betölteni és adatot programként
 Különálló kód- és adat-címtartományokkal rendelkezik
 A bithossz eltérő lehet
 Manapság módosított módon használják
kép19

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Neumann architektúra

A

Lényege (a fentihez képest): a programkód és az adatok együttes kezelése, tárolása.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Első generációs szuperskalárok tulajdonságai

A
Jellemzők:
 Nem pufferelt vagyis közvetlen utasítás kibocsátás: dekódolás után rögtön küldi tovább a VE- nek az utasítást.
 Statikus elágazáselőrejelzés amint a lehívási (FETCH) alrendszer végez. A programkód bizonyos tulajdonságai alapján dönt az ugrásról. Jól ismeri fel a ciklusokat.
 2 szintű gyorsítótár
o L1: a CPU lapkán
 adatgyorsítótár
 utasításgyorsítótár 
o L2: külön lapkán
 2-3 végrehajtó egység
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Példa: első generációs szuperskalárok kibocsátása

A

Kibocsátjuk a független i1 utasítást.
Utasítás feldolgozás sorrendben történik. Ezért mivel a második utasítás nem hajtható végre, valamilyen függőségre vár, ezért a harmadik utasítás sem fog végrehajtódni.
A következő óraciklusban az i2 utasítás függősége már feloldódott, ezért kibocsátható mind az i2, mind pedig az i3.
Ezzel az utasításablak kiürült.
Feltöltjük a kiürült utasításablakot 3 további utasítással. Közülük az i4 és az i5 független, ezért kibocsátjuk, míg az i6 a függőségek feloldásáig vár a kibocsátásra.
I6 utasítás kibocsátásra kerül.
Utasításablakot feltöltjük. I7 feloldása után nincs függőség. 0 db kibocsátott utasítás
Összes kibocsátása (nincs függőség)
kép20

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Végrehajtási modell

A

Ez egy egyszerűsített működési modell, RISC architektúra.
3 fő részből áll:
1. Első rész: utasítás lehívás (F), utasítás ablak feltöltés
2. Utasítás ablak
3. Hátsó rész: utasítás ablakkiürítés, dekódolás (D), függőség ellenőrzés, kibocsátás, végrehajtás
(E), visszaírás (W/B).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Végrehajtási modell jellemzők

A

 Alrendszerek: F, D, E, W/B
 Az alrendszerek pufferekkel vannak elválasztva
 A rendszer szélessége: hány utasítást képes feldolgozni ciklusonként. Ezt a legkisebb
kibocsátási képességgel rendelkező alrendszer határozza meg. (Pl PC-nél a HDD.) Ez az egész
rendszer átbocsátási tényezője
 Kibocsátási szűk keresztmetszet (D)
 Az operandusok az architektúrális regiszterből kerülnek betöltésre
 Az eredményeket az architektúrális regiszterbe vagy az operatív tárba írja ki
 A feldolgozási ráta közelít az 1-hez! (max. 2 db. utasítás / ciklus)
o < 1 db. utasítás / ciklus a kibocsátásnál o < 1 db. utasítás / ciklus a feldolgozásnál

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Függőségek kiküszöbölve, csökkentve a végrehajtási modellben

A

 Memória függőségek csökkentve
 Előrejelzés késleltetése csökkentve
 Erőforrásfüggőségek csökkentve
 Adatfüggőségek NEM csökkentve. A valós és az ál-adatfüggőség is blokkol!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Keskenység

A

 nyilvánvalóan a memória, illetve elágazásfeldolgozás miatt:
o legnagyobb akadály: kibocsátási szűk keresztmetszet
 Oka: közvetlen kibocsátás
o a memória problémát a gyorsítótárakkal (L1, L2) kezeljük, csökkentve a szűk
keresztmetszetet
o az elágazásfeldolgozást statikus becsléssel javítjuk.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Példa: Intel Pentium I (első generációs szuperskalár) alaptulajdonságai

A
  • 2 db futószalag, 2 db VE
  • 1 db V futószalag
  • dedikált
  • egyszerű fx, L/S, branch utasítások
  • 1 db U futószalag
  • univerzális/mester
  • minden más művelet elvégzésére
  • 5 fokozat
  • F lehívás
  • D dekódolás
  • AG - címszámítás
  • E végrehajtás
  • W/B visszaírás
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Példa: Intel Pentium I (első generációs szuperskalár) újdonságai

A

-bármely x86 utasítás végrehajtása
-belül 64 bites busz
-kívül 32 bites, vagyis 2 ciklus kell a belső busz feltöltéséhez
-ugrás előrejelzés, ehhez 2 db prefetch puffer
-2 db, egyenként 8 kB-os belső cache:
o egy a programkódnak
o egy az operandusoknak

17
Q

Példa: Intel Pentium I (első generációs szuperskalár) végrehajtási modellje

A

kép22