Les 4 Big data en artificiële intelligentie: basisconcepten Flashcards
(15 cards)
Big data 3 Vs
Velocity = dynamische aard van het proces waarmee de data worden gegenereerd en geanalyseerd
Volume = enorme hoeveelheid gegevens
variety = diversiteit aan gegevensbronnen en datatypes die worden verzameld en geanalyseerd
Bigdata = datagedreven analyse en op correlaties georiënteerd
datagedrevene als doel patronen verbanden in datasets te vinden
geen oorzakelijk verband = correlatie
Big data proces
1: data verzamelen en voorbereiden
2: eigenlijke analyse van de data
3: Het nemen van beslissingen of het maken van beleidskeuzes
We willen inzichten en informatie verkrijgen en in de praktijk gebruiken
Datamining
het proces waarbij grote hoeveelheden data worden geanalyseerd om verborgen patronen, verbanden en nuttige informatie te ontdekken.
voorspellende technieken
= classificatie (spam email)
= regressie (numerieke voorspellingen)
beschrijvende technieken
= cluster (groeperen obv sterke overeenkomsten)
= associatie (associatieregels opstellen obv verbanden tussen data)
profilering
individueel profiel = verzameling eigenschappen van 1 persoon
groepsprofiel = verzameling van kenmerken die een bepaalde groep van personen beschrijven.
distributief = altijd specifieke kenmerk hebben
niet-distributief = gemiddeldes, niet per se specifieke kenmerk hebben
Toepassingen datamining
Predictive policing = waar en wanneer een verhoogd risico is op nieuwe criminele activiteiten
webcrawling = internet systematisch en automatisch doorzoeken naar mogelijk verdacht materiaal
learning analytics = opvolgen leerproces van studenten en relevante verbanden vinden tussen studieresultaten en andere gegevens.
AI doorbraken
AI heeft zomers en winters
MacCarthy grondlegger (1955)
Doorbraken:
AlfaGO = AI wint van beste GO speler
AI verslaat Gasparov
AI wint in jeopardy
Chatgpt
AI definitie
er is geen algemeen aanvaardde definitie van AI
Russell & Norvig: vier manieren om AI aan te duiden
systemen die zich gedragen als een mens (cf. Turing test)
systemen die denken als een mens
systemen die zich rationeel gedragen
systemen die rationeel denken
Juridische definitie AI
AI wet treedt 2024 in werking –> deze bevat een juridische definitie van een AI systeem
Maar zeer vaag
kenmerken AI
AI wordt voornamelijk gekenmerkt door 2 zaken:
autonomie = mogelijkheid om zelf in complexe gegevens te handelen zonder (constante menselijke tussenkomst)
aanpassingsvermogen = capaciteit om taken beter uit te voeren door zelf te leren
Onvoorspelbaar
Ondoorzichtigheid
Gebrek aan transparantie of begrijpelijkheid
= black box
AI indeling
Enge AI systemen = kunnen maar een of een paar specifieke taken zeer goed uitvoeren, over het algemeen zelfs beter dan mensen (maar kan ook alleen dat).
Brede AI systemen = AI systemen die in staat zijn de kennis in een domein in een ander domein toe te passen en dit in samenwerking met andere AI systemen of mensen
Super AI = AI die een orde van grootte slimmer is dan de mens
Twee AI stromingen
Kennisgebaseerd (top down/symbolic)
= Kennis van experts gieten in een AI systeem
Voordeel: de inhoud en het gedrag van het kennissysteem zijn herkenbaar
nadelen: tijdrovend en arbeidsintensief
datagedreven (bottom up/machinaal leren)
= machines die in data uit zichzelf kunnen leren, redeneren, beslissingen nemen en handelen, zonder dat iemand hen tellens moet vertellen wat ze moeten doen.
Lagen van AI
AI
machinaal leren
Neurale netwerken
Deep learning
Neurale netwerken
Een neuraal netwerk wordt gevormd door het verbinden van meerdere neuronen.
Onderzoekers organiseren die verbindingen meestal in lagen, waarbij de neuronen van één laag worden gekoppeld aan die van de volgende.
De eerste laag die de oorspronkelijke input ontvangt = invoerlaag
laatste laag die output genereert = uitvoerlaag
inspiratie = werking van het brein
Unieke eigenschappen:
Neuronen kunnen tegelijkertijd grote hoeveelheden data parallel verwerken
De opslag en verwerking van gegevens is niet gescheiden
Hoe leren neurale netwerken?
Gesuperviseerd
= werken met gelabelde data en een supervisor
=Proces van optimalisatie
- classificatie en regressie
- arbeidsintensief en duur
Ongesuperviseerd
= werken zonder gelabelde data, neuraal netwerk moet zelf structuur aanbrengen in de data
Versterkend
= een predictief model opbouwen door telkens een terugkoppeling te krijgen van het systeem
(straffen of belonen)
Types neurale netwerken
Feedforward = verbinden tussen de knooppunten vormen geen cyclus
Informatie wordt slechts in een richting door het netwerk verstuurd, geen terugkoppeling.
(patroonherkenning of classificatie)
Recurrent = ontworpen om gegevens te verwerken waarbij de volgorde belangrijk is.
De vorige input kan meetellen in de predictie van de huidige toestand van het systeem.
(spraak, muziek, tekst)
Convolutioneel = een type diep neuraal netwerk dat bijzonder geschikt is voor de verwerking van gegevens met een rasterstructuur, zoals afbeeldingen en videos.
Speciale lagen voeren convocaties uit
(complexere visuele taken)