Test Flashcards

Question

Zadaci leksickog analizatora.

Answer 1

Leksičkim analizatorom se realizuje faza leksičke analize u procesu prevođenja jezika. Odnosno, u kodu se identifikuju leksičke celine koje imaju neki sintaksni smisao, transformišu se u simbole (tokene) i prosleđuju se sintaksnom analizatoru. Pored ove osnovne uloge leksički analizator obavlja još neke zadatke: Izbacuje iz ulaznog koda delove koji nisu značajni za sintaksnu analizu: komentare, praznine (blanko znake), tab i newline simbole. Usklađuje listing grešaka sa ulaznim kodom. Npr. vodi računa o broju newline simbola, što se koristi kod referenciranja na greške.

Answer 2

Leksema – izdvojena rec, ulazni niz koji se prepoznaje na osnovu formalnog opisa pomocu sablona I za koji se generise odredjeni token Token – znacenje izdvojene reci, izlazni simbol koji se generise kada je prepoznat odredjeni ulazni niz znakova. Sablon – regularni izraz, formalni opis ulaznih nizova za koje se generise odredjeni token.

Answer 3

Za svaki regularni izraz se moze definisati konacni automat koji ga prepoznaje.

Answer 4

Sintaksni analizator prima niz tokena od leksičkog analizatora i proverava da li taj niz pripada jeziku koji je opisan zadatom gramatikom. Cilj sintaksnog analizatora je da generiše sintaksno stablo za ulazni niz tokena. U odnosu na to kako obavljaju sintaksnu analizu postoje dva tipa sintaksnih analizatora: (algoritmi) Top-down analizatori koji vrše analizu odozgo naniže (kreće od startnog simbola i pokušava da primenom konačnog broja smena taj startni simbol preslika u kod koj se analizira) Sleva nadesno (krajnje levo izvođenje) Zesna nalevo (krajnje desno izvođenje) ukoliko se dobija isto sintaksno stablo gramatika je regularna (ekvivalentna jednoznačna gramatika) ako ne gramatika je NEJEDNOZNAČNA (ispravno je sintaksno stablo zdesna nalevo) levo asocijativni operatori * i + desno asocijativni operatori = prioritetniji operatori moraju da budu niže u sintaksnom stablu Bottom-up analizatori koji vrše analizu odozdo naviše (polazi od ulaznog koda i vrši redukciju koda na startni simbol gramatike)

Answer 5

U slučaju Top-down analize polazi se od startnog simbola i nastoji se da se odrede pravila koja treba primeniti da bi se generisala reč čija se analiza vrši. To znači da se pravila otkrivaju u redosledu u kom se i primenjuju prilikom generisanja reči, odnosno odozgo naniže ako se to posmatra na sintaksnom stablu. Kod ovog postupka analize krece se od startnog simbola I bira se prvo pravilo kojim se startni simbol preslikava u neku fazu. Posle toga u svakom koraku se nastoji da se prvi neterminalni simbol sa leve strane zameni desnom stranom prvog raspolozivog pravila za taj neterminalni simbol. Prakticno, nastoji se da se generise analizirani niz levim izvodjenjem. Ukoliko na nekom koraku ne postoji odgovarajuca smena, vracamo se natrag do nivoa na kome je primenjeno poslednje pravilo I trazimo alternativno pravilo koje moze da se primeni. Analiza je uspesna ako se kao rezultat ovog postupka dobije niz koji se analizira. Ako se vracanjem unazad ponovo dodje do startnog simbola gramatike I vise nema novih alternativa za zamenu tog simbola, postupak analize je neuspesan. Ovakav algoritam može da bude prilično neefikasan zato se prave algoritmi bez vraćanja.

Answer 6

Top-down sintaksnom analizom se generiše skup smena čiji redosled primene odgovara levom izvođenju. Zbog toga ovaj postupak analize ne može da se primeni kod tzv. levo rekurzivnih gramatika. Levo rekurzivne gramatike su gramatike kod kojih postoje levo rekurzivna pravila, odnosno pravila oblika: A → Ar, gde je A∈ Vn, a r∈ V* Kod ovakvih pravila preslikavanjem neterminala A dobija se reč koja opet počinje istim neterminalom, i to se iz koraka u korak ponavlja, odnosno ulazi se u jednu beskonačnu petlju, tako da analizu nije moguće završiti. Resenje: Svaku levu rekurzivnu gramatiku moguce je transformisati u ekvivalentnu nerekurzivnu gramatiku. Ako gramatika sadrzi skup pravila za isti neterminalni simbol, medju kojima su neka levo rekurzivna, a neka ne: A -> A α1 | A α2 |… | A αn | β1 | β2 | … | βm Ovaj skup pravila moguce je zameniti sledecim skupom nerekurzivnih pravila A -> β1 | β2 | … | βm | β1 A’| β2 A’| … | βm A’ A’ -> α 1 | α 2 | … | α n | α 1 A’| α 2 A’| … | α n A’ Moguca je I sledeca transformacija: A -> β1 A’| β2 A’| … | βm A’ A’ -> α 1 A’| α 2 A’| … | α n A’ |ξ u ovakvim situacijama top-down algoritam nije primenljiv i gramatiku treba nekako transformisati - eliminacija (oslobažanje od) levo rekurzivnih smena kada postoji rekurzivna smena u gramatici mora da postoji i jedna ne rekurzivna koja treba da prekine rekurziju desno rekurzivna smena A’ -> α 1 A’ ξ nije pogodno za neke gramatike pa postoji alternativna eliminacija rekurzije bez njega A -> Aα | β A -> β A’ A -> β | β A’ da se beta javlja samo ili sa alfa (nizom alfa) A’ -> α A’ | ξ A’ -> α | αA’

Answer 7

Osnovni problem kod polaznih algoritama za sintaksnu analizu je veliki broj povratnih koraka tako da je sam postupak analize dosta dug i neizvestan. Efikasni analizatori za top-down analizu koji u svakom koraku vrse neku vrstu predikcije na osnovu koje odlucuju koje ce se pravilo primeniti. Smene se otkrivaju direktno bez povratnih petlji. Kod ovih analizatora odluku o pravilu koje ce da se primeni se donosi i na osnovu slova u ulaznom nizu koje treba da se prepozna, na kome je trenutno ulazni pokazivac. Primenjuje se pravilo koje ce sigurno da generise bar to slovo. Ovakvi analizatori su poznati kao LL (1) analizatori (Look-Left 1), gde cifra 1 ukazuje na to da se predikcija vrsi na osnovu jednog slova u nizu. Generalno gledano, mogu da se definisu i LL-k analizatori kod kojih se predikcija vrsi na osnovu reci duzine k, ali su LL-1 mnogo upotrebljiviji. Ograničenje koja treba da zadovolje smene gramatike: Ukoliko za preslikavanje jednog neterminalnog simbola postoji veći broj smena, na osnovu sledećih k ulaznih simbola koje treba dobiti jednoznačno je određeno koja će se smena primeniti. Na početku analize se u radni magacin upisuje granični simbol (#) i startni simbol gramatike, zatim se na osnovu simbola sa vrha radnog magacina i tekućeg ulaznog simbola iz LL(1) sintaksne tabele čita akcija koja će biti izvršena.

Answer 8

Proste LL-1 gramatike su beskonteksne gramatike kod kojih sve smene za isti neterminalni simbol počinju različitim terminalnim simbolima: A → a1α1 | a2α2 |…| anαn gde je ai ∈ Vt , αi ∈ V*,∧ ai ≠ a j za i ≠ j

Answer 9

Pokazali smo da se u slučaju LL-1 gramatika može vršiti prediktivna sintaksna analiza koja je mnogo efikasnija od osnovnog algoritma za sintaksnu analizu. Veoma značajno u svemu tome je da se gramatike koje ne zadovoljavaju uslov LL-1 gramatika mogu jednostavno transformisati u ovaj tip gramatika. Naime, ukoliko u gramatici postoji veći broj pravila za isti neterminalni simbol koja na desnoj strani imaju reči sa istim prefiksom, odnosno smene oblika: A → αβ1 | αβ2 |…| αβn | γ gde su α, β1, β2 ,, βn ,γ ∈V * i A∈Vn , takva gramatika sigurno nije LL-1 gramatika. Međutim ona se transformiše u LL-1 gramatiku sledećom smenom: A → αA'| γ A'→ β1 | β2 | … | βn uvedena je leva faktorizacija da se reši problem što desna strana više smena počinje istim prefiksom

Answer 10

Ukoliko postoji smena oblika X → α, definiše se funkcija FIRST(α) koja sadrži sve terminalne simbole koji mogu da se nađu na početku reči izvedenih iz niza α, tj: Ako jeα ∈ V + FIRST (α ) = {a | α ⎯⎯*→ aβ , a ∈ V , β ∈ V *} Funkcija FOLLOW se definiše za neterminalne simbola, kao skup terminalnih simbola koji mogu u toku izvođenja da se nađu iza tog neterminalnog simbola, ili: FOLLOW ( A) = {a ∈ V | S' ⎯⎯*→αAγ , A, S'∈ V , γ ∈ V + } gde je a ∈ FIRST(γ ) i S' startni simbol gramatike. Po definiciji FOLLOW funkcija startnog simbola gramatike sadrži granični simbol #. Za odredjivanje FOLLOW funkcije neterminalnog simbola X posmatraju se desne strane pravila u kojima se pojavljuje posmatrani simbol. Pri tome simbol X na desnoj strani smene može da se nađe u jednom od sledećih konteksta: Z → α X xβ ∧ x∈Vt ⇒ x∈FOLLOW(X) Z → α XYβ ∧ Y∈Vn ⇒ FIRST(Y)⊂FOLLOW(X) Z → α X ⇒ FOLLOW(Z)⊂FOLLOW(X) FIRST () - Skup terminalnih simbola koji mogu da se pojave na početku reči izvedenih iz date smene . FOLLOW fja je uvedena da bismo mogli da odredimo kada treba primeniti ξ smenu FOLLOW je skup terminalnih simbola koji u razvoju mogu da se nađu iza posmatranog neterminala Nalazimo taj neterminalni simbol na desnoj strani smena i imamo 3 situacijeČ iza njega se nalazi terminalni simbol iza njega se nalazi neki neterminalni simbol nalazi se na kraju smene

Answer 11

Beskonteksna gramatika bez ε pravila je LL-1 gramatika ako su za sva pravila za isti neterminalni simbol oblika: A →α1 | α 2 |…| αn skupovi FIRST(α1 ), FIRST(α2 ),…, FIRST(αn ) disjunktni po parovima, odnosno: FIRST(αi ) ∩ FIRST(αj ) = Φ, i ≠ j.

Answer 12

Beskonteksna gramatika koja sadrzi ξ je LL-1 gramatika ako I samo ako za sva pravila oblika A →α1 | α 2 |…| αn i A -> ξ vazi: FIRST(αi ∘ FIRST(A)) Ո FIRST(αj ∘ FIRST(A)) = prazan skup Za svako .. gde je simbolom ∘ oznacena operacija nadovezivanja. Ovaj uslov moze da se iskaze I na sledeci nacin: Za sva pravila A →α1 | α 2 |…| αn treba da vazi: FIRST(αi) Ո FIRST(αj) = prazan skup za svako i ≠ j Ako je αi -> ξ , tada mora da vazi i: FIRST(αj) Ո FOLLOW(A) = prazan skup |w| <= 1 - znači da može da bude terminalni simbol dužine 1 ili 0 - prazna reč SAD se menja definicija FIRST funkcije Č FIRST funkcija sadrži terminalne simbole koji se nalaze na početku reči izvedenih iz posmatrane smene ili praznu reč ukoliko smena može da se preslika u praznu reč MORA DA VAŽI ako imamo više smena za preslikavanje neterminalnog simbolaČ FIRST fje svih smena moraju da budu međusobno disjunktne - to važi i bez Epsilon smena ako se neka od tih smena preslikava u prazan niz A SME SAMO 1 FIRST fja za ostale smene mora da bude disjunktna sa FOLLOW fjom za neterminal sa leve strane ZAŠTO? zato što će se eps smena primenjivati kada se pojavi neki od simbola koji pripada FOLLOW skupu zato FOLLOW ne sme da saadrži iste simbole kao FIRST fja

Answer 13

Za sintaksnu analizu jezika definisanih LL-1 gramatikama koristi se magacinski automat I sintaksna tabela kao pomocna struktura. U opštem slučaju Sintaksna tabela se sastoji od onoliko kolona koliko ima terminalnih simbola, a onoliko vrsta koliko ima neterminalnih i terminalnih simbola zajedno. Polja tablice sintaksne analize se popunjavaju tako da se u polju koje odgovara neterminalu A, i terminalu a, upisuje smena koja na levoj strani ima neterminal A, a na desnoj strani reč koja počinje terminalom a, ako takva smena postoji. U preseku vrste koja je označena terminalom i kolone koja je označena istim tip terminalom upisuje se vrednost pop, dok se u preseku vrste i kolone koje su označene graničnim simbolom # upisuje vrednost accept. Sva ostala polja su polja greške. Sintaksna tabela T(A, a), gde je A oznaka vrste, a a oznaka kolone se formalno može definisati na sledeći način: ⎧ pop ako je A = a, a ∈ Vt ⎫ ⎪ acc Ts( A, a) = ako je A =#∧a ∈# ⎪ ⎨(aα , i) ako je A ⇒ aα i − to pravilo⎪ ⎪⎩ err u svim ostalimslucajevima ⎪⎭

Answer 14

Isto kao 29

Answer 15

U slučaju Bottom-Up analize primenjuje se postupak redukcije reči koja se analizira. Osnovni algoritam za analizu se sastoji u tome što se ulazni niz analizira slovo po slovo od početka prema kraju i nastoji se da se neki njegov podniz prepozna kao desna stana nekog od raspoloživih pravila gramatike. Kada se takav podniz pronađe vrši se njegova redukcija na levu stranu primenjene smene i postupak nastavlja sve dok se niz ne redukuje na startni simbol. Kao i kod osnovnog algoritma za Top-down analizu i ovde ima vraćanja unatrag i poništavanja primenjenih smena u slučaju kada dođe do greške i ne može da se ide dalje sa analizom. Pri realizaciji ovog algoritma koristi se magacin u koji se ubacuje slovo po slovo iz ulaznog niza. Pri tome se u svakom koraku ispituje da li je moguće izvršiti redukciju niza (po nekoj smeni - da li se ono što je na vrhu magacina anlazi sa desne strane neke smene) koji je u vrhu magacina. Ako redukcija nije moguća u magacin se ubacuje novo slovo, a ako je moguća prepoznati niz sa vrha magacina se redukuje na neterminal koji je na levoj strani primenjene smene, odnosno neterminal zamenjuje redukovani niz u magacinu. Analiza je uspešno izvršena kada se dođe do graničnog simbola a u magacinu ostane samo startni simbol. ako ne može u njemu postoji sintaksna greška

Test Flashcards

(39 cards)