8.Tétel:Első generációs (keskeny) szuperskalár processzorok Flashcards

1
Q

Párhuzamos kibocsátás (szuperskalár CPU-k) I. és II. generáció

A

Közös jellemzői:
Az utasítások végrehajtását alapvetően többszörözéssel, azaz több VE használatával érik el.
1) Kibocsátási (térbeli) párhuzamosság: a CPU a dekódoló egységből képes óraciklusonként több
utasítást kibocsátani. Kibocsátási ráta max. 2 – 6 utasítás
Működési elv:
kép20
A függőségekkel maguk birkóznak meg dinamikusan. (extra hardver)
Kompatibilitás (pld x86 architektúra) evolúciós fejlődés.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Első generációs keskeny szuperskalár processzorok

A

(keskeny => kibocsátási szűk keresztmetszet)
• RISC CPU estén MAX 2-3 utasítás / ciklus
• CISC CPU esetén MAX 2 utasítás /ciklus
Jellemzői:
• Nem pufferelt (közvetlen) utasítás kibocsátás
• Statikus elágazásbecslés (ezt a lehívási FETCH alrendszer végzi) a > 0 ugrik a >= 0
ugrik a < 0 folytatja sorrendben a != 0 folytatja sorrendben Gyorsítótárak:
2 szintű:
o L1 -CPU lapkán
- adat
gyorsítótár
- utasítás
gyorsítótár o L2 – külön
lapkán
• 2-3 végrehajtó egységgel rendelkezett

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Harvard architektúra (1944)

A

Lényege: A programkód és az adatok fizikailag elkülönített útvonalon mozognak.
Párhuzamos adat utak => teljesítménynövekedés
Manapság módosított Harvard architektúrát alkalmaznak.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Harvard architektúra vezérlési vázlata

A

kép21

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

I. generációs szuperskalár

A

Közvetlen nem pufferelt utasítás kibocsátás. (dekódolás után egyből küldi a VE-nek az utasítást)
Utasítás ablak: olyan puffer, amely az adott ciklusban kibocsátandó utasításokat tartalmazza.
Itt történik a dekódolás és a függőség ellenőrzés is. Független utasítások szabad VE -khez kerülnek.
Működési alternatívák:
Utasítás ablak feltöltése történhet:
o utasításonként
o egyszerre az összes (amikor az utasítás ablak kiürül)
Utasítások feldolgozása történhet:
o sorrendben
o sorrenden kívül
Kezdetben az utasítások feldolgozása sorrendben, az utasításablak feltöltése egyszerre történt.
kép23

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Kibocsátási séma első generációs szuperskalároknál

A

Kibocsátjuk a független i1 utasítást.
Utasítás feldolgozás sorrendben történik. Ezért mivel a második utasítás nem hajtható
végre, valamilyen függőségre vár, ezért a harmadik utasítás sem fog végrehajtódni. (kép24)
A következő óraciklusban az i2 utasítás függősége már feloldódott, ezért kibocsátható
mind az i2, mind pedig az i3.
Ezzel az utasításablak kiürült. (kép25)
Feltöltjük a kiürült utasításablakot 3 további utasítással.
Közülük az i4 és az i5 független, ezért kibocsátjuk, míg az i6 a függőségek feloldásáig
vár a kibocsátásra. (kép26)
I6 utasítás kibocsátásra kerül. (kép27)
Utasításablakot feltöltjük. I7 feloldása után nincs függőség.
0 db kibocsátott utasítás (kép28)
Összes kibocsátása (nincs függőség) (kép29)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Végrehajtási modell

A

A legkisebb átbocsájtási képességgel rendelkező alrendszer határozza meg az egész rendszer
átbocsájtási tényezőjét.
Egyszerűsített működési modell (RISC) A
rendszer 3 részből áll:
1.) első rész o feladata: utasítás lehívás, utasítás ablak
feltöltése
2.) hátsó rész o feladata: dekódolás, függőség ellenőrzés, kibocsátás, végrehajtás,
visszaírás
3.) utasítás ablak (összeköti a két részt)
Az operandusok archiktetúrális regiszterből kerülnek betöltésre.
kép30
Szélesség: hány utasítást képes feldolgozni ciklusonként. -> A teljes rendszer átbocsájtó képességét a
legkisebb átbocsájtó képességgel rendelkező alrendszer fogja meghatározni.
Kibocsátási szűk keresztmetszet!
Kiküszöbölt, csökkentett függőségek:
• Memória függőséget csökkentve
• Előrejelzés késleltetés csökkentve
• Erőforrás függőség csökkentve
• DE! Adatfüggőséget nem tudtuk csökkenteni!
o mind a valós mind az álfüggőség blokkolt
Általános célú alkalmazásoknál a rendelkezésre álló utasítások száma kb. 2 db/ciklus, a
kibocsátási szűk keresztmetszet miatt ennyire korlátozódott.
Kibocsátás: RISC 2-3 utasítás/ciklus, CISC 2 utasítás/ciklus.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Esettanulmány Pentium 1 processzor működési modellje

A

• 2 futószalaggal rendelkezett.
• 1 db V futószalag (dedikált) FX egyszerű,LS, branch utasítások elvégzése
• 1 db U futószalag (univerzális/master) minden más művelet elvégzésére alkalmas volt Ennek
kiegészítése volt egy 3 fokozatos FP (lebegőpontos) futószalag
(RISC CPU 2-4 db dedikált futószalag)
A futószalagok 5 fokozatúak
F D AG E W/B
F – fetch - lehívás, D – decode, AG - címszámítás, E – execute, W/B write back- visszaívrás Újdonság:
• belül 64 bites busz
• kívül 32 bites  két ciklus alatt töltötte fel a belső buszt
branch prediction - ugrás előrejelzés, ehhez 2 db prefetch puffer
2 db egyenként 8 kbyte belső cache: o Egy a
programkódnak.
o Egy az operandusoknak.
kép31

How well did you know this?
1
Not at all
2
3
4
5
Perfectly