Pirma dalis Flashcards
(45 cards)
Mašininis mokymas
Algoritmų ir modelių kūrimas, leidžiantis DI sistemoms išmokti atlikti užduotis efektyviau
Prižiūrimas mokymas
Modelis mokomas naudojant pažymėtus duomenis, kur kiekvienai įvesčiai yra žinoma teisinga išvestis
Pusiau prižiūrimas mokymas
Naudojamas nedidelis kiekis pažymėtu duomenų kartu su dideliu kiekiu nepažymėtu
Neprižiūrimas mokymas
Naudojamas nepažymėtas duomenų rinkinys ir modelis pats išmoksta jų struktūra bei ryšius tarp jų
Skatinamasis mokymas
Modelis gauna arba atlygį arba bauda už savo veiksmus
Duomenų skaidymas
Skirsto į 3 grupes - mokymosi, validavimo, testavimo
Klasifikavimas
Mašininio mokymo uždavinys, tikslas - priskirti įvesti vienai iš galimų klasių
Dviejų klasių klasifikavimas
Objektų priskyrimas vienai iš dviejų galimų klasių
Daugelio klasių klasifikavimas
Leidžia priskirti objektą vienai iš daugiau nei dviejų galimų klasių
Klasifikavimo metrikos
Naudojamos įverinti klasifikavimo modelio prognozių tikslumą
Tikslumas (accuracy)
Parodo kokia dalis modelio prognozių buvo teisingos
Preciziškumas (precision)
Parodo, kokia dalis modelio prognozuotų teigiamų atveju yra tikrai teisingi
Atkūrimo statistika (recall)
Parodo, kokią dalį visų tikrųjų teigiamų atveju modelis sugebėjo atpažinti
F1 Statistika
Harmoninis tikslumo ir atkūrimo vidurkis
Klasifikavimo lentelė (confusion matrix)
Matrica, kurioje pavaizduota, kiek prognoziu buvo teisingos ir klaidingos
Naivusis Bajeso klasifikatorius
Remiasi tikimybių teorija ir daro prielaida, kad požymiai tarpusavyje nepriklausomi
Sprendimų medis
Modelis, kuris priima sprendimus sekdamas šakomis pagal duomenų savybes
Sprendimų medžio veikimas
Mokymo metu išrenkamas duomenų kintamasis, pagal kurį duomenys padalijami į dvi grupes, tai atliekama kol pasiekiamas stabdymo kriterijus
Sprendimų medžio stabdymo kriterijai
Pogrupyje lieka per mažai duomenų, skirtymo kokybė nebepagerėja, medis pasiekia nustatyta maksimalų gylį
Atsitiktinis miškas
Naudoja daugybę sprendimų medžių, kiekviena su atsitiktinai parinktai duomenimis, galutinis rezultatas nustatomas pagal medžių balsavimą
K artimiausių kaimynų algoritmas
Priskiria objektą tai klasei, kuriai priklauso dauguma artimiausių (k) kaimynų
Atraminių vektorių metodas (SVM)
Ieško geriausios ribos, skiriančios skirtingas klases erdvėje
Kaip parenkama SVM riba
Kad atstumas iki artimiausių duomenų taškų abiejose pusėse būtų kuo didesnis, artimiausi taškai vadinami atraminiais vektoriais
Klasterizavimas
Neprižiūrimas mokymo metodas, skirtas grupiuoti panašius duomenų taškus į klasterius pagal savybes