Introduction Flashcards

1
Q

wat is data science

A

werken met en analyseren van ‘data’, gegevens

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

wat is data

A

informatie in ruwe of ongeorganiseerde vorm die verwijst naar objecten, ideeën of condities

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

wat betekent data driven

A

verzamelen en analyseren van data ligt aan basis bedrijfsstrategie en van dagelijkse besluitvorming

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

waarom wordt data opgedeeld

A

om overzicht te behouden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

welke indelingen zijn er

A
  1. op basis van data type
  2. op basis waarvoor data binnen bedrijf gebruikt word
  3. indeling, aard en manier van opslaan van data
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

3 soorten data types:

A

master data, transactionele data en analytische data

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

master data

A

data die niet vaak verandert en wordt door business steeds op zelfde manier gebruikt (bv klantnummer), ‘normale data’

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

transactionele data

A

verandert voortdurend en betreft dagelijkse businessativiteiten, beschrijft gebeurtenis (bv bestellingen, bitcoins), vooral financieel

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

analytische data

A

data betreffende performantie van business (bv marktaandeel, solvabiliteitsratio’s), data van analyses

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

manier van opslaan (2):

A

gestructureerd, ongestructureerd

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

gestructureerde data

A

sterk georganiseerde data die volgens voorgedefinieerd data model wordt opgeslagen, op eenvoudige manier toegankelijk en kan gemakkelijk zonder bijkomende inspanningen gebruikt worden in analyses (bv data relationele databanken)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

ongestructureerde data

A

niet opgeslagen volgens voorgedefinieerd data model en wordt op samenhangende en verspreide manier bijgehouden, moeilijk toegankelijk en vereist bijkomende preprocessing voor gebruikt te worden in analyse (bv data in meeting verslagen, rapporten)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

alternatieve opdelingen:

A
  1. op basis van doel van data output (purpose data ouptut)
  2. streaming data versus static data
  3. indeling volgens attitudinal, behavioural of demographic data
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

2 doelen van data output:

A
  1. schema-then-capture, eerst bepalen welke data nodig is voor analyse en dan verzamelen
  2. capture-first-ask-questions-later, data verzamelen en nadien kijken welke vragen/ analyses men met data kan beantwoorden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

attitudinal data

A

hoe voelt een klant zich, weerspiegelen belang dat klant hecht aan bepaalde eigenschappen van aangeboden producten en diensten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

behavioural data

A

wat doet een klant, omvat koopgedrag en merkvoorkeur van consumenten en wordt gebruikt om promotiecampagne uit te werken

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

demographic data

A

wie is klant, data die sociaaleconomisch van aard is (bv populatie, ras, inkomen), die specifieke geografische locaties vertegenwoordigen en vaak geassocieerd met tijd

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

eigenschappen van big data

A

1) hoge data velocity
2) groot volume
3) grote variety

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

velocity

A

snelheid waaraan data gegenereerd, gecapteerd en/of afgeleverd wordt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

variety

A

diversiteit, data komt van vele verschillende bronnen en zit in meerdere databanken in niet uniforme vormen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

2 extra eigenschappen big data

A

1) variability

2) veracity

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

veracity

A

waarheidsgetrouwheid, kwaliteit van data

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

proces van big data naar smart data

A

selectie (verzamelen), opkuisen/zuiveren (verfiëren, valideren), verwerking (classificeren) en voorbereiding (in juiste formaat zetten)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

waar zorgt selectie voor

A

relevante data

25
waar zorgt opkuisen/zuiveren voor
correcte data
26
waar zorgt verwerken/voorbereiden voor
computer verwerkbare data
27
wat zijn meetschalen/ meetniveau's
zegt wat je met data kan doen
28
2 soorten meetschalen
1) kwalitatief | 2) kwantitatief
29
kwalitatieve data
getallen maar niet om mee te rekenen, bepaalt meestal categorie, bv geslacht
30
kwantitatieve data
getallen, bv temperatuur, leeftijd, afstand
31
2 types binnen kwalitatieve data
1) nominaal | 2) ordinaal
32
nominaal
iedere waarde is string, opsomming, bv tomaat appel peer
33
ordinaal
iedere waarde is string, volgorde, bv tevredenheidsscores
34
2 types binnen kwantitatieve data
1) interval | 2) ratio
35
interval
verschillen tussen waardes, bv temperatuur in °C, tijdstip, datum
36
ratio
verhoudingen, temperatuur in Kelvin, # liter wijn, 1/4 van klas is gebuisd
37
karakteristieken meetniveau
1. onderscheidingsvermogen 2. grootteorde-karakteristiek 3. meeteenheid 4. absoluut nulpunt
38
cardinalisering
wanneer waarden van eigenschap niet numeriek zijn en men ze vervangt door getallen
39
discriminantanalyse
techniek waarbij men berekeningen maakt met waargenomen waarden van meerdere eigenschappen van bv zelfde personen
40
multicriteria analyse
keuze maken tussen verschillende alternatieven, rekening houdend met meerdere doelstellingen
41
continue variabele
alle waarden zijn kommagetallen, eender welke waarden tussen 2 grenzen
42
discrete variabele
enkel bepaalde waarden, bv gehele
43
betrouwbaarheid
iets dat weinig invloed heeft van buitenaf, levert meetinstrument onder identieke omstandigheden zelfde waarden?
44
validiteit
meet meetinstrument wat beweert te meten?, wat is bruikbaarheid en wat is juistheid
45
hypothese
mogelijke uitkomst, wat je denkt, bewering/veronderstelling
46
operationaliseren
iets meetbaar maken
47
dikw-piramide
Data, Information, Knowlegde, Wisdom
48
verschillende onderzoeksfasen van klassiek (statisch) onderzoek
1. formuleren van vraagstelling, probleem, theorie 2. meetbaar maken, operationaliseren 3. steekproefopzet 4. verrichten van metingen, verzamelen van gegevens 5. beschrijven van gegevens 6. formuleren van statische conclusies 7. verband tussen resultaten en theorie
49
BI
business intelligence, stelt model op om specifiek gekende businessvragen te kunnen beantwoorden
50
OLAP
Online Analytical Processing
51
4 vormen data analytics
1) descriptive analytics (what happened) 2) diagnostic analytics (why did it happen) 3) predictive analytics (what will happen) 4) prescriptive analytics (how can we make it happen)
52
analyseren van data (3 delen)
1. data mining 2. machine learning 3. statistiek
53
data mining
betreft zoeken van bruikbare patronen, verbanden en associaties in data door data te beschrijven, samen te vatten, te groeperen
54
machine learning
computer programma 'leert' uit aangeboden data en past geleerde data toe op nieuwe data
55
statistiek
betreft verzamelen, bewerken, interpreteren en presenteren van gegevens
56
populatie
groep waar je testen op uitvoert
57
steekproef
doen van metingen
58
aselect
willekeurig
59
beschrijvende statistiek
info uit data halen