Antra dalis Flashcards by Saules Zuikutis

Nuostolių funkcijos (loss)

Matuoja skirtumą tarp modelio prognozių ir tikrųjų reikšmių.

How well did you know this?

Not at all

Perfectly

Kam reikalingos nuostolių funkcijos?

Padeda modeliui suprasti kiek jo prognozės skiriasi nuo tikrovės, algoritmas tuomet atnaujina modelio svorius, kad sumažintų klaidą

How well did you know this?

Not at all

Perfectly

Vidutinės kvadratinės paklaidos (MSE) nuostoliu funkcija

Skaičiuoja kvadratinių skirtumų tarp prognozuotų ir tikrųjų reikšmių vidurkį

How well did you know this?

Not at all

Perfectly

Kryžminės entropijos (cross-entropy) nuostoliu funkcija

Matuoja skirtumą tarp tikrosios klasės ir modelios prognozuotų tikimybių

How well did you know this?

Not at all

Perfectly

Optimizatoriai

Algoritmai, kurie nustato, kaip atnaujinti neuroninio tinklo svorius mokymo metu, siekiant sumažinti nuostolių funkciją

How well did you know this?

Not at all

Perfectly

Stochastinis gradientų nusileidimas (SGD optimizatorius)

Optimizavimo metodas, kuris atnaujina svorius po kiekvieno duomenų pavyzdžio

How well did you know this?

Not at all

Perfectly

Adam optimizatorius

Sujungia inercijos (momentum) metodą ir adaptuojamus mokymosi tempus, dėl to efektyviai konverguoja daugelyje situacijų

How well did you know this?

Not at all

Perfectly

Reguliarizacija

Metodų rinkinys, padedantis sumažinti testavimo paklaidą ir išvengti permokymo

How well did you know this?

Not at all

Perfectly

Ankstyvasis sustabdymas

Mokymas stabdomas, kai modelio tikslumas testavimo metu nebegerėja, siekiant išvengti permokymo

How well did you know this?

Not at all

Perfectly

Rinkinio (batch) normalizacija

Normalizuoja sluoksnio įėjimus, mažina vidaus kintamumą ir paspartina mokymą

How well did you know this?

Not at all

Perfectly

Atsitiktinio praretinimo tranformacija (Dropout)

Mokymo metu atsitiktinai išjungia dalį neuronų, priversdama tinklą būti atsparesnį ir išmokti geresnių apibendrinimų

How well did you know this?

Not at all

Perfectly

Duomenų augmentacija (augmentation)

Duomenų išplėtimo metodas, kuriuo sukuriami nauji pavyzdžiai keičiant esamus

How well did you know this?

Not at all

Perfectly

L2 reguliarizacija

Prideda baudos terminą už didelius svorius, todėl modelis yra skatinamas rinktis mažesnius svorius ir mokytis iš paprastesnių sprendimų

How well did you know this?

Not at all

Perfectly

Kompiuterinė rega

Leidžia kompiuteriams analizuoti ir interpretuoti vizualinę informaciją iš vaizdų ar vaizdo įrašų

How well did you know this?

Not at all

Perfectly

Objektų aptikimas

Ne tik atpažįsta objektų klases paveikslelyje, bet ir nusako jų tikslias vietas (ribines dežutes)

How well did you know this?

Not at all

Perfectly

Vaizdų klasifikavimas

Study These Flashcards

Priskiria visam paveikslėliui vieną klasę

Semantinis segmentavimas

Study These Flashcards

Priskiria kiekvienam vaizdo pikseliui klasę, leidžiant tiksliai pažymėti objektų ribas paveikslėlyje

Kovoliucija

Study These Flashcards

Pagrindine operacija konvoliuciniuose neuroniniuose tinkluose, leidžianti aptikti vietinius duomenų bruožus, tokius kaip kražtai ar tekstūros

Kokiu būdu veikia konvoliucija

Study These Flashcards

Ji atliekama taikant “slankiojanti langą” (filtrą), kuris juda per įvesties duomenis, išgaudamas vietines savybes

Konvoliuciniai neuroniniai tinklai (CNN)

Study These Flashcards

Specializuoti neuroniniai tinklai, skirti vaizdinių duomenų apdorojimui.

Kaip veikia CNN

Study These Flashcards

Jie automatiškai išmoksta išgauti reikšmingas savybes iš paveikslelių, naudodami mažų dydžių filtrus (branduolius), kurie leidžia sumažinti parametrų skaičių ir skaičiavimo sudėtingumą

Sutelkimas (pooling)

Study These Flashcards

Sumažina erdvinį duomenų dydį, išlaikydamas svarbiausią informaciją.

AlexNet

Study These Flashcards

Pirmasis gilus CNN tinklas, pirmasis plačiai panaudojo ReLU aktyvacijas ir sudėtines konvoliuvines struktūras

VGG, ResNet

Study These Flashcards

VGG turėjo 16-19 sluoksnių tinklą, ResNet įvedė likutinius ryšius (skip connections), leidžiančius treniruoti labai gilius tinklus

Rekurentiniai neuroniniai tinklai (RNN)

Skirti sekoms apdoroti, jie išlaiko informaciją apie ankstesnes įvestis per vidinę būseną.

Rekurentinis neuronas

Gauna įvesti ne tik iš ankstesnio sluoksnio, bet ir iš savo ankstesnės būsenos

RNN būsena

Saugo informaciją apie ankstesnes įvestis, tarsi tinklo "atmintis", ji perduodama tarp laiko žingsnių

RNN būsenos atnaujinimas

Kiekviename laiko žingsnyje būsena atnaujinama naudojant dabartinę įvestį ir ankstesnę būsena, leidžiant modeliui sekti kontekstą laiko tėkmėje

Atgalinis sklidimas RNN tinkluose

Skirtas RNN mokymui, kai klaidos gradientai skaičiuojami per kelis laiko žingsnius

Sprogstantys gradientai

Situacija, kai gradientai tampa labai dideli, dėl ko svoriai atnaujinami pernelyg stipriai, tinklas tampa nebestabilus

Ilgos trumpalaikės atminties modelis (LSTM)

RNN variantas, kuris efektyviau valdo ilgalaikę informaciją, naudodamas vidinę atmintį ir specialias sklendęs, taip išsprendžiant nykstančių gradientų problemą

LSTM sklendės (gates)

Yra trys pagrindinės sklendes - įvesties, pamiršimo ir išvesties, kurios reguliuoja kiek informacijos įsiminti, pamiršti ar perduoti, suteikiant lankstų informacijos valdymą

Transformerių neuroniniai tinklai

Gilių neuroninių tinklų architektūra, pagrįsta dėmesio (attention) mechanizmais

Dėmesio sutelkimo transformacija (attention)

Leidžia modeliam suteikti skirtingą svarbą įvesties sekos elementams, atsižvelgiant į jų tarpusavio ryšius

Dėmesio sutelkimo sau transformacija (self-attention)

Leidžia kiekvienam įvesties sekos elementui įvertinti visus kitus elementus ir nuspręsti, kuri informacija yra svarbiausia

Daugelio galvučių dėmesio sutelkimo transformacija (multihead-attention)

Tuo pačiu metu atliekamos kelios dėmesio operacijos su skirtingomis parametrų grupėmis

Operacijų skaičius reikalingas dėmesio sutelkimo transformacijai

Transformacijos skaičiavimų sudėtingumas didėja kvadratiškai pagal sekos ilgį (O(n²))

Pozicijos kodavimas

Būdas pridėti informaciją apie žodžiu eiliškumą, nes transformeriai savaime nesupranta sekos tvarkos

Transformerių neuroninių tinklų architektūros

Sudarytos iš enkoderiu ir dekoderių, kuriuose naudojami dėmesio mechanizmai ir feed-forward tinklai

Antra dalis Flashcards

(39 cards)