TIG 122 - Maskininlärning och dataanalys Flashcards

Question

Tensor

Answer 1

En matematisk struktur Lagrar vikter och bias i neurala nätverk Representerar och bearbetar data

Answer 2

0D tensor: Ett enda tal (skalar). 1D tensor: En vektor (en lista av tal). 2D tensor: En matris (en tabell med rader och kolumner). 3D tensor: En "matris av matriser" (t.ex. en kub av data).

Answer 3

Vanligt inom maskininlärning Representerar input datan och vikterna i modellen Enkel representation av data

Answer 4

Ett utrymme där vektorer kan placeras Används för att beräkna avstånd och likheter mellan data punkter

Answer 5

Ger information om hur många rader, kolumner och dimensioner en array har Ger information om hur många element en array har

Answer 6

Om datan behöver processas innan den används i nätverket för att omvandla till ett mer effektivt format

Answer 7

Justerar värden i datasetet så det ligger inom ett viss intervall Kan på så sätt behandlas mer effektivt i modellen

Answer 8

En funktion som avgör värdet på datan för att få skicka vidare information eller inte

Answer 9

Aktiveringsfunktion Framställer ett sannolikhetsvärde för varje möjlig output och den med störst sannolikhet blir sedan den slutgiltiga outputen

Answer 10

Aktiveringsfunktion ¨ Används ofta i dolda lager Introducerar icke-linjäritet Omvandlar alla negativa värden till 0 och låter alla positiva vara oförändrade Lär sig komplexa mönster i datan

Answer 11

Färdigställer det för träning Specificerar viktiga inställningar - 3 parametrar

Answer 12

1. Loss function - t.ex definierar om nätverkets sanna värden 2. Optimizer - Styr hur vikterna förändras under träning 3. Matrics - Undersöker hur bra modellen presenterar på träning

Answer 13

Inbyggd funktion i keras som baserat på träningsdata justerar modellens vikter

Answer 14

Epoker är gångerna man kör igenom träningsdata genom modellen

Answer 15

Gör att en viss andel av träningsdatan sparas undan för att istället kunna använda under validering Modellen kan då testas på data den tidigare inte exponerats för vilket övervakar generaliseringsförmågan

Answer 16

Använder evolutions algoritmer för att att automatiskt skapa, justera och förbättra arkitekturen hos ANN - Syftet är att hitta den bästa strukturen utifrån specifika problem - t.ex hur många lager nätverket ska

Answer 17

Representation av data i from av siffror för beräkningar

Answer 18

En viktad summa Dimension 0 En matematisk operation mellan två vektorer. Använda för att beräkna ett mått på likheten mellan två vektorer

Answer 19

Två vektorer som är lika långa multiplicerar koordinaten med respektive koordinat i den andra vektorn Sedan adderar alla produkter med varandra t.ex - w1*x1 + w2*x2

Answer 20

2 dimentionell datastruktur Rader presenterar någon from av egenskap Kolumner presenterar en annan form av egenskap Definierar all data ihop

Answer 21

Förvarar data Organiserar olika typer av data i flera dimensioner

Answer 22

En samling data av samma typ som man organiserar

Answer 23

En samling bilder som används för att träna maskininlärnings modeller för att utföra uppgifter som bildklassificering, objektigenkänning osv

Answer 24

Partial derivatas

Answer 25

En linje som rör vid kurvan vid en viss punkt

Answer 26

Lutningen hos tangent line i de olika punkterna

Answer 27

y = kx +m k = lutningen Väljer 2 punkter på linjen dividerar skillnaden i x -led mot skillnaden i y/x = k Räknar ut linjens lutning men får då hur mycket kurvan lutar i just den punkten

Answer 28

Lutningen hos tangent linjen c = f(c) Talar om hur mycket det lutar i en punkt på kurvan

Answer 29

1. väljer ut ett antal data punkter man ska träna sitt nätverk på (information från indata) 2. För varje input testar man då och får en output 3. Räknar sedan ut loss function för varje data punkt 4. Algoritmen gardient decent används sedan genom att räkna ut derivatan och avgör sedan hur vi ska förändra vikterna för att få ett mindre loss

Answer 30

Optimerings algoritm som räknar ut derivatan (lutningen) av loss function med avseende av vikterna = gradienten (lutningen) Gradienten talar om hur mycket loss function förändras om vikterna ändras Gör ofta små förändringar i taget och uppdaterar vikterna i rätt riktning för att minska loss Går igenom alla punkter i datan

Answer 31

Samling av data som mats in i modellen

Answer 32

Används för träning av modellen ' Justerar modellens interna parametrar genom att minimera loss function - 70%

Answer 33

Används för att justera hyperparamtrar (inställningar som inte lärs av modellen) t.ex inlärningshastigheet, antal lager osv Kontrollerar modellens prestanda och generaliserbarhet - 15%

Answer 34

Används efter träning för att utvärdera modellens generaliserbarhet på osedd data - 15%

Answer 35

Mått som används för att uppskatta hur bra en modell presterar mäter genomsnittet av loss function

Answer 36

Modellens förmåga att prestera bra på ny data den inte tidigare har expanderats för Modellen lär sig hitta mönster i träningsdatan som den sedan kan applicera på ny data

Answer 37

1. Använd lagom komplex data 2. Avsluta träningen när prestandan på valideringsdatan slutar förbättras 3. Öka variationen i träningsdatan

Answer 38

Processen som sker när man minimerar loss founction Handlar om att hitta en punkt där loss function är tillräckligt låg i träningsdatan

Answer 39

Det kan leda till overfitting

Answer 40

Modellen har lärt sig träningsdatan för bra Betyder att modellen inte har lärt sig hitta mönster hos träningsdatan utan istället lärt sig detaljer och saker som är unikt för träningsdatan (memorerar istället för att förstå "reglerna")

Answer 41

Modellen kommer presetera bra på träningsdatan men kommer misslyckas med data som den tidiagre inte har exponerats för

Answer 42

1. Skapa variation i träningsdatan 2. Öka mängden träningsdata

Answer 43

Modellen är för enkel eller otränad för att identifiera underliggande mönster i datan Presterar dåligt på både träninngsdata och osedd data

Answer 44

1. Modellen är för simpel, finns inte tillräckligt med parametrar som kan fånga komplexitet i datan 2. Träningen har avbrutits för tidigt

Answer 45

Bar generaliserbarhet Påverkas inte av enstaka extremvärden

Answer 46

Slumpmässiga fel eller irrelevanta variationer i datan som inte återspeglar de mönster vi vill att modellen ska lära sig

Answer 47

1. Brus kan göra att modellen tvingas hitt mönster 2. Slumpmässiga förändringar i datan får modellen att fokusera på mönster och ej enstaka detaljer

Answer 48

Metod för maskininlärning Skapar nya datapunkter mellan två eller flera redan existerande punkter Med syfte att fylla i luckor eller skapa smidiga övergångar mellan redan kända punkter Skapar mer träningsdata

Answer 49

Räknar ut loss function metod för en mer pålitlig utvärdering av en modell

Answer 50

Viktigt att alla dataset speglar den verkliga datan som modellen kommer att stöta på i praktiken

Answer 51

Viktigt att alla dataset spegalr verkliga förhållanden, då förändringar sker

Answer 52

Undvika identiska datapunkter i treänings och test data då modellen kan ha memorerat

Answer 53

Optimeringsalgoritm Fungerar på samma sätt som GD, men istället för att gå igenom alla punkter i datan uppdaterar den endast enskilda och slumpmässiga punkter. Bra för att hantera stora dataset

Answer 54

Optimeringsalgoritm Kommer ihåg tidigare gradienter Använder medelvärden av gradienter baserat på historik kräver ofta justering av hyperparametrar Olika dtapunkter jämförs inte med varandra utan kan lära sig i sin takt

Answer 55

Hyperparemeter Styr hur stora steg optimeraren ska ta i justering av modellens vikter under träning Kan vara bra att göra små förändringar för att inte missa viktiga steg, men kan gå långsamt

Answer 56

Hur många exempel av träningsdatan modellen bearbetar innan vikterna uppdateras under träning

Answer 57

Tabell som används för att utvärdera prestandan hos en klassificeringsmodell Jämför loss fuction och visar hur många exempel som är korrekta och hur många som blev fel

Answer 58

Perceptron En rak linje kan separera data punkter

Answer 59

En rak linje kan inte separera datapunkterna korrekt Behövs något mer komplext med fler lager och neuroner

Answer 60

Kan uppstå i träning av MLP Svårigheter med att identifiera vilka vikter eller parametrar som är ansvariga för felaktiga resultat

Answer 61

Använder backpropagation

Answer 62

Hierarkiskt upplägg där mer komplex mönster uppfattas av senare lager Olika neuroner är specialiserade på att känna igen olika typer av visuell information

Answer 63

En av de första CNN - 80-90 talet Kombinationen av hierarkisk bearbetning och backpropagation Fullt ansluta lager 5 lager

Answer 64

2012 det stora genombrottet för CNN djupare nätverk = 8 lager

Answer 65

Bildigenkänning, bildklassificering och objektidentifiering

Answer 66

Varje neuron är kopplad till ett receptivt fält i nästa lager, dvs en lokal region av neuroner

Answer 67

1. Konvolutionslager / Convolutional layer 2. ReLU - lager 3. Pooling - lager 4. Fullt anslutet lager

Answer 68

Extraherar egenskaper i indatan genom filter och feautermaps

Answer 69

Introducerar icke-linjäritet i modellen Vilket innebär att alla negativa värden sätts till 0

Answer 70

Minskar dimensionerna hos feature maps, behåller de framträdande egenskaperna, vilket gör modellen mindre känslig för små förändringar t.ex filtreras brus bort

Answer 71

Alla neuroner mellan två nätverk är kopplade till varandra, Kombinerar alla egenskaper/features och fattar ett slutgiltigt beslut som sedan skickas genom aktiveringesfunktionen

Answer 72

Sannolikhets funktion Ger ett värde mellan 0-1 för aktivering av värdet Klassificerar ett värde/ skalär i taget

Answer 73

Sannolikhets funktion¨ Ger ett värde mellan 0-1 för aktivering Klassificerar en hel vektor samtidigt/ flera värden

Answer 74

Filtret flyttas steg för steg över input bilden Varje element i bilden multipliceras med motsvarande pixelvärde Summan blir sedan en siffra som placeras i lagrets feauture map

Answer 75

Representerar vad/hur mycket ett filter har hittat i form av egenskaper/ mönster i olika delar av bilden indelad i delar av bilden vilket motsvarar neuroner

Answer 76

3x3 Feture map Uträkningen: 1 2 3 1*1 + 2*0 + 3* (-1) + 4 5 6 4*1 + 5*0 + 6* (-1) + 7 8 9 7*1 + 8*0 + 9 * (-1) = 1 = summan i den första rutan i feature mapen, sedan hoppar den så många stride den har vilket innebär steg filtret ska ta

Answer 77

Minskar dimensionerna hos fetaure map för att hjälpa modellen med spatial Invariance Väljer det största värdet i varje del av pooling mapen

Answer 78

Gör att nätverket i träning inte fastnar i var något befinner sig i bilden, utan kan fånga en mer generaliserad bild och känna igen egenskaper oberoende av storlek, placering eller vridning i bilden

Answer 79

Visual cortex fungerar på samma sätt: Olika delar processar olika saker i form av nivåer t.ex v1 processar minsta egenskaperna i bilden v2- processar färg osv

Answer 80

Ytlig modell 1 lager , lagret har 5 filter vilket innebär 5 feture maps

Answer 81

klassificering av objekt i bilder eller videos

Answer 82

Algoritmen skannar bilden och identifierar var objekten finns genom att placera bounding boxes runt varje upptäckt objekt

Answer 83

Koordinaterna i övre vänstra hörnet samt nedre högra hörnet

Answer 84

Efter lokalisering, tilldelar modellen varje bounding box en etikett, baserat på vad den tror finns i boxsen vi sannolikhets funktion

Answer 85

Letar efter intressanta områden för att sedan i nästa steg klassificera de - tvåstegs modell Regioner föreslås, varje region beräknas och skickas genom ett CNN för att undersöka egenskaper i regionen Mycket noggrann men också mycket långsam

Answer 86

Identifierar både var och vad objektet är i bara ett steg Kan fånga objekt i olika storlekar då den består av flera feature maps som kan fokusera på olika skalor av objekt Använder default boxex, som alltså är förbestämda boxar som placeras ut över bilden 1. om det finns ett objekt i boxen klassificera 2. Behöver boxen justeras för att passa objektet

Answer 87

1. Localization loss - justerar boxarnas position 2. Confidence loss - Förbättring av klassificering av objekt

Answer 88

Bilden delas in i ett rutnät, där varje cell i rutnätet förutspår ett visst antal bounding boxes Genererar alltså många överlappande boxar, som sedan används för att använda de mest sannolika snabb, men tenderar att missa små objekt

Answer 89

Radar, kameror oh ljudsensorer för att "se" och känna igen omgivningen

Answer 90

Kontrollerar gas, broms och styrning baserat på beslutsfattande av datorn

Answer 91

Processorer som bearbetar data från sensorer genom algoritmer och fattar beslut

Answer 92

Ingen automation Människan är fullt ansvarig för körning av bilen

Answer 93

Förarassistans Stöttning i from av styrning och bromsning

Answer 94

- Delvis automation Föraren måste vara aktiv och redo att ta över körningen

Answer 95

- Begränsad automation Föraren måste vara beredd att ta över körningen om systemet ber om det

Answer 96

- Hög automation ODD (operativ design domän) - Bilen fungerar autonomt inom en förutbestämd miljö

Answer 97

- Full automation ej nått hit ännu

Answer 98

Skapar en gemensam standard för att beskriva autonomi

Answer 99

Säkerhetssystem som övervakar förarens beteende och uppmärksamhet Används i bilar med nivå 2-3 Kameror riktade mot förarens ansikte för att spåra ögonrörelser, huvud position, blinkningar och ansiktsuttryck

Answer 100

ersätter backspeglar med kameror och digitala skärmar Täcker fler vinklar och kan anpassas till olika ljusförhållanden samt tar mindre plats Systemet kan ge varningar för andra fordon eller fotgängare

Answer 101

EU:s allmänna uppsättning av regeler och krv som syftar till att öka säkerhten för vägtrafikanter

Answer 102

Första steget i NPL Delar upp text i mindre enheter tokens (meningar)

Answer 103

Tekniker för att representera ord i numeriska vektorer Där ord med likdanande semantisk betydelse hamnar nära varandra i modellens minne

Answer 104

Encoder - Skapar en kontextuell representation av input Decoder - Använder den tidigare skapade representationen för att generera utdata

Answer 105

NPL fick sitt stora genombrott 2017 Kan processa ord parallellt

Answer 106

I och med att transformerna processar ord parallellt, modellen information om ordens position i sekvensen En unik vektor läggs därför till i varje word embedding baserat på dess position i sekvensen

Answer 107

Varje word embedding baseras på både position och innehåll

Answer 108

Varje ord representeras av en binär vektor där platsen ordet finns i sekvensen representeras av 1 och resten med 0

Answer 109

Word embeddings ger orden representationer av vektorer, där ord som liknar varandras får likdanande vektorer

Answer 110

1. Varje ord i sekvensen jämförs med resterande ord i modellen för att avgöra ordets betydelse i meningen 2. Modellen räknar sedan ut hur mycket uppmärksamhet/ attention varje ord ska ge de andra orden i sekvensen och omvandlas sedan nya representationer för varje ord 3. De nya representationerna bygger på Query - vad söker vi efter, key- vad har varje ord att erbjuda och Value - vad är själva innehållet 4. De nya vektorerna multipliceras sedan med inlärda vikt matriser 5. Softmax används sedan för att skapa en sannolikhet för varje representation

Answer 111

Query - Vad vi söker efter Key - vad varje ord har att erbjuda Value - Vad själva innehållet är

Answer 112

Flera paralella attention huvuden används för att fokusera på olika aspekter av meningen t.ex syntax, semantik, kontext osv

Answer 113

Masken sätter alla framtida attention-vikter till 0 för att modellen inte ska veta vad som kommer som nästa ord utan den ska träna på att förutspå mönstret

Answer 114

De tidigare representationerna som gjorts i encodern placeras in. Hämtar information i form av K och V från den tidigare representationen, medans Q alltså vad vi söker efter är information den plockar från sig själv Kopplar ihop hela sekvenser och skapar representationer från olika sekvenser tillsammans

Answer 115

Finns efter varje attention block Finns två fullt anslutna lager och ReLU funktion Bearbetar varje token baserat på attention för att sedan kunna lära sig mönster

Answer 116

Följer en norm efter varje feed-forward och attention i transformerna för att stabilisera träningen

Answer 117

Kommer alltså i nummer och softmax genererar sedan de ordet som med stört sannolikhet ska genereras efter utifrån representationerna från attention lagrarna

Answer 118

Handlar om att göra ai begripligt och transparant för människor Målet är att kunna förklara varför den fattat ett beslut

Answer 119

Handlar om hur väl modellen presenterar sin logisk på ett sätt människan förstår

Answer 120

Handlar om hur vida modellen fattar beslut som make sense i det specifika området

Answer 121

Hur modellen förklaras a) Intrinsic Explainability (Inbyggd förklarbarhet) b) Post-hoc Explainability (Förklaringar efteråt)

Answer 122

Hur förklaringen presenteras för användaren a) Visual Explanations (För slutanvändare b) Mathematical/Computational Explanations (För utvecklare c) Language-Based Explanations (För slutanvändare

Answer 123

Modellen är designad för att vara självförklarande Kräver ingen extra analys för att förstå beslutet Använder t.ex beslutsträd

Answer 124

Komplexa modeller där beslutet inte är direkt tolkningsbart Kräver en analys efter att modellen fattat ett beslut Deep Learning modeller

Answer 125

En metod för att förklara hur neurala nätverk fattar beslut Post -hoc används efter modellen har tränats Specifik för neurala nätverk - model specifik kollar på hela modellen Lokal - förklarar individuella förutsägelser

Answer 126

Post hoc Lokal och global model - agnostisk

Answer 127

Post hoc model -specifik global

TIG 122 - Maskininlärning och dataanalys Flashcards

(153 cards)