coderen Flashcards

(53 cards)

1
Q

kenmerken van multivariate technieken

A
  • kwantitatief
  • toetsend of explorerend
  • datareductie of modeltoetsing
    • Modeltoetsing: bepaalde uitkomstmaten kijken, waar we de relaties veronderstellen tussen die uitkomstmaten en verschillende oorzakelijke factoren. We onderzoeken vervolgens hoe die relaties liggen en of de verbanden überhaupt aanwezig zijn en of zij dezelfde richting hebben als we theoretisch veronderstellen
  • hoog versus laag
    voorspelling versus samenhang
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Univariate technieken

A

technieken die slechts 1 variabele gebruiken

- descriptieve maten gebruiken

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

bivariate technieken

A

technieken met 2 variabelen

- correlaionele mate gebruiken

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Multivariate technieken

A

3 of meer variabelen gebruiken

-geintegreerde analyse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

codeboek

A

= technisch verslag waarbij je duidelijk maakt hoe je van een varzglijst naar een databestand gaat

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Coderen: bijkomende punten en samenvattende regels

A
  • overzichtelijke vragenlijst (genummerd)
  • duidelijk en consequent codeboek (‘veldcoderen’ uitsluiten)
  • afspraken voor ‘weet niet’ (7, 77,…), ‘geen antwoord’ (8, 88,…), ‘niet van toepassing’ (9, 99,…): zie bv. codeboek SCV survey
  • afspraken voor filtervragen
  • afspraken voor onduidelijke antwoorden
  • afspraken verwerking meerdere antwoordmogelijkheden
    data-entry
    data-cleaning
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

rol van statistiek

A
  • inferentiële: modelleren van onzekerheid. hoe waarschijnlijk is een resultaat onder een bepaalde veronderstelling van een resultaat, wetenschap probaliteit
  • beschrijvende statistiek
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Modellen

A

beangrijkste structuur van een fenomeen weergeven
- structuurovereenkomst met de werkelijkheid die ze beschrijven
onafhankelijk van de werkelijkheid

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Bivariaat symmetrische technieken

A

= verband beschrijven

  • pearson correlatie (metrç’sch)
  • spearman en kendall tau (ordinaal)
  • kruistabbelen, chi² en odds ratio (nominaal)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Pearson Correlatiecoëfficient

A
  • som v/d afwijkingen van de individuele score van het gemiddelde op variabele X
  • maal de afwijking van de individuele score van het gemiddelde op variabele Y
  • gedeeld door de standaarddeviaties van X en Y
  • gecorrigeerd door de steekproefgrootte
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Pearson correlatiecoëfficient oppassen

A
  • uitschieters

- lineaire verdeling noet kwadratisch of longitudinaal

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Chi² oppassen

A
  • geen observaties => hercoderen en minder categoreën
  • kleine steekproeven (N<20) fisher exact test
  • 2x2 tabel: continuity correction (indien de verwachte waarde in 1 of meer <5
  • 20% of meer cellen een verwachte frequentie <5
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Odds ratio

A

= verhouding relatief risico
-hoeverre een score op de ene variabele een risicoverhoging geeft voor een score op de andere variabel
gebruikt
- logistischeregressie analyse
- beter pearson als de gegevens scheef verdeeld zijn

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Parametrische toetsen met 2 groepen

A

assumptie
- gelijke verdeling van de populatie
- afhanekelijk variabel is een continu metrische
types
- onafhankelijke steekproeven
- varianties van beide populaties zijn gelijk
- varianties van beide populaties zijn nier gelijk
=> alternatieve berekeing van t en df
- afhankelijke steekproeven
=> geen varuiantie berkenene: gaan ervan uit bij dezelfde groep dat deze veranderd is

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Niet-parametrische toetsen met twee groepen

A

Assumptie
- vervalt
Mann Whitney test

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

parametrische toetsen met meer dan twee groepen

A

assumptie
- normaal verdeeld in de populatie
- afhankelijke variable is een continu metrische variabele
afhankelijke
- anova: analyse of variance, F-toets, variantieanalyse

F-toets

  • groter naarmate de between en de within variantie kleiner worden
  • between: afwijking of verschillen tussen gemiddelde van de 3 groepen
  • within: de variantie van de groepen zelf

sneller significant
- verschillen gemiddelden vrij groot en de spreiding tussen de groepen zeer klein zijn

=> conclusie globaal => tussen 2 groepen doen moet je een post hoc test doen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Niet parametrische toetsen met meer den twee groepen

A

assumptie

  • afhankelijke variabel is ordinaal of metrisch
  • niet-normaal verdeelde variabel

test
- kruskall wallis

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

likertschaal

A
  • s reeks vragen/stellingen
  • meten van concepten
  • 4/5 tot 7 antwoordcatagorieën
  • positie op een continu kenmerk weergeeft
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

schaaltechnieken

A

schaal als verzameling van items die geacht worden eenzelfde eigenschap te meten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

cronbachs alpha

A

maat van intern consistentie waarbij er gekeken wordt naar de globale samenhang tussen variabelen
- variabelen of items in de schaal zijn ongeveer gelijk
- doel achterliggende houding, trak, attutude, …
wie hoog scoort op ene item, scoort hoog op het andere item

belangrijk

  • over hetzelfde onderwerp
  • schaal bevat voldoende items
  • vragen andersom formuleren en dit afwisselend

relatieve maat: het varieert doordat het aan de hand van gemiddelde correlatiecoëfficient berekend is

0-1
- ondergrens .60-.80 => afhanekelijk van aantal items

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

weinig interne samenhang

A

1 schaal tweedmimensioneel
2 invers geformuleerde vragen
3 construct meerdere schale of dimensie bevat

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

correlatiematrix

A

= symmetrische maat van bivariate samenhang

23
Q

eigenwaarde

A

= maat voor de verklaarde/gedeelde variantie van een principale componentanalyse
eigenwaarde groter dan 1 zijn om meer variantie te hebben dan in de individuele

24
Q

indicatoren van principale component

A
  • metrische variabel
  • ordinaal: likert schaal (best 5-6 antwoordcategorieën)
  • substantiële factorlading >.30
  • opletten kruisladingen
25
Hoeveel componenten of factoren?
- afhankelijk van de structuur - eigenwaarde criterium - sree plot, scree criterium, knik criterium - interpreteerbaarheid criterium
26
assumptie PC
- variabelen zijn normaal verdeeld - niet te veel ruis in de meting: variablen betrouwbaar zijn - relaties tussen de variabelen zijn lineair - min interval meetniveau
27
Prediction
in hoeverre zeggen scores op de ene variabele of ene set van variabelen iets over een andere variabelen - situaring regressieanalyse
28
forecasting
= als we weten dat wat X is, dan kunnen we Y voorspellen | - situering bij de regressieanalyse
29
e
=voorspelfout, gesommeerde afstand van de punten tot de rechte - error, residuele fout, residu als ei klein is wilt dit zeggen dat ^yi heel dicht is bij de echte ^y = yi - ^yi
30
schattingsprocedure
fitten van de rechte = kleinste kwadrant | => som van kwwadraten van de errortermen wordt geminimaliseerd
31
regressieanalyse
- vaak gebruikt - voorspeellen, verklaren - verklaren van een theorie - theorievorming - forecasting - prediction voordeel: info over voorspelling oplevere nadeel: bouwen en interpretern van het model is niet altijd even gemakkelijk
32
Niet zomaar zoveel mogzlijk predictoren nemen om de R² zo groot mogelijk te maken, 2 overwegingen
* Inhoudelijke: theoretische overweging van het opnemen van voorspellers => anders black box benadering * Kanskapitalisme: techniek kapitaliseert op toevallige, uniek combinaties
33
regressiegewichten
= welk gewicht elke X-variabele krijgt in de regressievergelijking Gestandaardiseerde - schaalonafhankelijk => -1 en 1 - niet inhoudelijk - partiële correlatiecoëfficient: in de reeks ov na te gaan welke variabel het meest bijdraagt aan de AV. degene met het grootste regressiegewicht, kan onderling met elkaar vergelijken Ongestandaardiseerde - schaalafhankelijk: bepaald door de eenheid va de ov - inhoudelijk
34
kwaliteit van voorspelling regressieanalyse
R² = hoeveel van de variantie van y verklaard wordt door ov => goodness of fit maat - laag: niet significant is - verklarende variantie adjusted R² - gecorrigeerde maat voor hat aantal ov in het model - zoeken spaarzaam model = parsimonious => ov die een impact hebben op de Av
35
voorwaarden regressieanalyse
1) X en Y zijn metrisch - AV zeker - OV kan verschil - controleren door interpretatie en face validity 2) lineair verband tussen X en Y - curvelineaire rechte gaat niet - ander soort verband detecteert men niet - scatterplot plotten en kijken naar de rechte 3) OV hangen onderling niet sterk aan elkaar - multicollineariteit: problemen met de interpretatie e zorgt voor overlap => 1 uit de analyse laten - variablene correleren met .80 - enkel variabelen meenemen die i-uniek bijdrage aan de voorspelling van y - controleren correlatiematrix 4)outliners
36
3 extra assumpties: voorwaarden
1) waarneming zijn onafhankelijk, de kwaliteit van de voorspelling van de ene persoon is onafhankelijk van de andere persoon - de afstand t.a.v. de rechte. niet de bedoeling dat de afstand tot de rechte bepaald wordt door ander punt. - onafhankelijk steekproeven, waarbij de observatie niet beïnvloed wordt door steekproeven : durbin-watson toets 2) voorspelfouten zijn normaal verdeeld - errortermen zijn normaal verdeeld, agressieanalyse kan scheef zijn => av normaal erdeeld zijn, de afstand tot de rechte normaal verdeeld - grote steekproef nodig - oplossing logistische regressieanalyse: binair voorspellen of iemand in de groep zijn en niet kijke naar de spreiding 3) homoskedasticiteit: - errortermen gelijk verdeeld zijn over de waarden van X - puntenwolk dezelfde range heeft voor elke waarde van de OV. - bandbreedte gelijk blijft
37
Durbin-Watson toets
kijken waarnemeningen onafhankelijk zijn
38
F-toets
uitvoeren om te kijken of men de afzonderlijke gewichten kan meten. INdien deze sgnificant is kan dit
39
geeft aan hoeveel procent van de afhankelijke de onafhankelijke kan verklaren
40
Berekenen van regressieanalyse
1) R² 2) adjusted R² 3) nulhypothese maken 4) Ftoets 5) p-waarde 6) individuele kijken indien de F-toets significant is 7) B-waarde - significant of niet 8) intercept 9) verklarind geven 10) 3 assumpties + 4 voorwaarden
41
nadelen correlatiecoëfficient
gevoelig voor uitlijners | maar-t voor lineaire samenhang => niet kwadratische samenhang
42
Controleren op onmogelijke antwoorden
1) outliners 2) onmogelijke combinaties 3) frequentietabel 4) kruitabel
43
strategieën bij ontbrekende waarden
1 niets doen - litwise delition - vertekening van de data => niet toevallig 2 imputatie
43
strategieën bij ontbrekende waarden
1 niets doen - litwise delition - vertekening van de data => niet toevallig 2 imputatie
44
strategieën bij ontbrekende waarden
1 niets doen - listwise deletion - vertekening van de data => niet toevallig - zeker multivaiate analyse: verlies power, kleineere n 2 imputatie - invullen missing value - complexe of eenvoudige - mogelijk vertekening - probleem: uitgaan dat vraag toevallig niet is beantwoord => 2 analyses doen en kijken naar de correlatie
45
aard van de missing
MCAR: Missing Completely At Random MAR: Missing At Random MNAR: Missing Not At Random
46
variabelen klaarmaken voor analyse
Transformeren Hercoderen Sommeren
47
transformeren
``` bv. probleem met normale verdeling van de variabele ‘niets doen’ - robuuste techniek - indicatie van vertekening? transformatie betekenis van transformatie? ook hier: lapwerk… ```
48
Beschrijvende statistiek
maten centrale tendentie | maten voor spreiding
49
Inferentiele statistiek
- steekproeven en populatie - omgaan met onzekerheid - steekproefgrootte - betrouwbaarheidsintervallen - verdeling
50
Centrale tendentie
- beschrijvend emaat - gemiddelde - modus
51
maat coor spreiding
- beschrijvende statistiek - variantie - standaarddeviatie - range: : spectrum van je waarneming
52
fout gaan bij omgaan onzekerheden
- te kleien steekproef - te veel ruis in de data dat samenhang in de ruis verdwijnt - assumptie van toetingsprocedure geschonden