Hoorcollege 4B: Kruistabellen & Tabelsplitsting Flashcards

(6 cards)

1
Q

(key points: samenhang is er als 1 getal sterk afwijkt van de andere getallen & altijd percentages in kolommen, onafhankelijke variabele in kolommen, dus ook interpreteren op kolommen (bovenste variabele eerst noemen)).

  1. Wanneer gebruik je een kruistabel?
  2. Waar staat fo en fe voor?
  3. Welke volwaarden moet een kruistabel aan voldoen?
A
  1. Je gebruikt een kruistabel wanneer je:
    - 2 variabelen met elkaar vergelijkt (dus bivariate analyse)
    - waarvan het meetniveau nominaal of ordinaal is.
    - als je wil weten of er een samenhang/associatie/verband is.
  2. fo= geobserveerde waarden=absolute waarden (8 mensen drinken cola het liefst), waarden die altijd in de kruistabel staan.
    fe (frequentie expected)= verwachte waarden = wat zouden de waarden zijn als er geen enkele samenhang zou zijn? (van percentages naar getallen maken).
  3. De expected count (fe: verwachte waarden) mag niet lager zijn dan 1, en 20% mag lager dan 5 zijn, dus 80% mag niet lager dan 5 zijn.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Toetsgrootheid= Chi2 (Chikwadaraat)

Welke (7) stappen moet je volgen om de Chikwadraat te toetsen?

H0: de geobserveerde waarden (f0) zijn gelijk aan de verwachte waarden in de populatie (fe) of F0-fe=0.
H1: de geobserveerde waarden zijn niet gelijk aan de verwachte waarden in de populatie.
»> hoe groter het verschil fo tussen fe is er een kans dat er wel een samenhang is. 8-4=4 > dus wel samenhang. En daarom de nullhypothese verwerpt kan worden.

A

Stap 1: de hypothese opstellen:
H0= in de populatie is er geen verband tussen interesse in fantasy en favoriete televisieserie.
H1: in de populatie is er wel een verband tussen interesse in fantasy en favoriete televisieserie.

Stap 2: Welke toetsgrootheid?
> Chikwadraat (chi2), want ik heb twee categorische variabelen. (Redenen waarom je deze toetsgrootheid doet). Wanneer bij een bivariate analyse het laagste meetniveau van een van de variabelen nominaal is, wordt gebruikt gemaakt van Chi2.

Stap 3: Welk significantieniveau?
> a=0,05.

Stap 4: Welke kritieke grenswaarde heb ik? (overschrijdinskans: atlijd opzoeken in tabel) (kijk in chi-kwadratentabel)
> Ook weer geldt hier een degrees of freedom (d), bij kruistabel: (k-1) (r-1).
Uitgerekend = (3-1) (3-1) =4.
> d=4, kijk in tabel naar 4 dan is onder het rijte a=0,05, je kritieke grens dan 9,49 is.

Stap 5: Voorwaarden van toetsen
> Maximaal 20% van de verwachte waarden (fe) mag lager zijn dan 5. (Dus 80% niet lager dan 5).
> En geen enkele verwachte waarden (fe) mag lager dan 1 zijn.
> Zie expected count voor de voorwaardencheck.

Stap 5b: waarde toetsgrootheid?
> Kijk bij ‘pearson chi-square)= 51,85

Stap 6: Vergelijk toetsgrootheid met kritieke waarde
> 51,85 is groter dan 9,49&raquo_space;> Dus H0 verwerpen, dus statistisch significant.
> Chikwadraat verdeling begint bij de 0 en heeft geen minwaarden.
> In rapportage schrijven ‘p<0,001’

Stap 7: conclusie en rapportage
> Uit een chikwadraattoets (toetsgrootheid) op een kruistabel
> Blijkt een significant verband
> Tussen de favoriete serie en interesse in fanatsy (2 variabelen herhaald)
> Bij adolescenten (onderzoekseenheden noemen)
> Chi2 (4, N=65) = 51,85, p < 0,001. (waarde p altijd op 3 decimalen!)
> De nulhypothese wordt verworpen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

(Effectgrootte=Als een resultaat significant is, dan ga je daarna op zoek naar hoe relevant het resultaat is. Associatiematen zijn de effectgroottes van de kruistabel)

  1. Welke associatiemaat is minimaal nominaal en symmetrisch?
  2. Welke associatiemaat is minimaal nominaal en ASYMMETRISCH?
A
  1. Cramers V en phi:
    Kenmerken:
    - laagste meetniveau is nominaal (dus al er een nominale variabele bevat)
    - minimale waarde (geen enkele samenhang)=0 en maximale waarde (perfecte samenhang)=1. Nog geen richting (-1).
    - het noemen van het sterkte van het verband.
    - interpreteren van minimaal 2 relevante percentages uit de tabel.
  2. Kruskal & goodman’s tau:
    kenmerken:
    - meetniveau is minimaal nominaal
    - in spss ‘lambda’ klikken en dan krijg je de tau
    - minimale waarde: 0 en maximale waarde: 1.
    - Doet een uitspraak over de mate van voorspellingsverbetering: kan ik y beter voorspellen als ik informatie heb over x? Kan ik de emoties (Y) bij kijken van een film beter voorspellen als ik weet of de respondent een man of een vrouw (X) is.
    - Sterke voorspelling in rapportage=== Als er een zwak verband is bij de kruskals en goodmans tau. Dan betekent dat dat we geen goede voorspelling kunnen doen over iemands favoriete televisieserie op basis van geslacht, of iemand een man of vrouw is. Sekse is dus geen goede voorspeller voor het favoriete televisieserie onder jongeren. Je wil op basis van iemands geslacht de favoriete televisieserie voorspellen (op basis van geslacht welke televisieserie zou een man leuk vinden?).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q
  1. Welke associatiemaat is minimaal ordinaal en symmetrisch?

2. Welke associatiemaat is minimaal ordinaal en ASYMMETRISCH?

A
  1. Gamma:
    - variabelen met minimaal ordinaal niveau.
    - effectgrootte bij een significant verband bij bivariate analyse
    - NU OOK richting erbij, en niet alleen de sterkte: minimaal waarde: -1 (perfecte negatieve samenhang), waarde 0= geen samenhang, maximale waarde =1 (perfecte positieve samenhang).
    - Toetsgrootheid: nog steeds chikwadraat, want je hebt 2 categorische variabelen (nominaal en ordinaal).
    - rapportage met richting erbij.
  2. Somers’d:
    Kenmerken:
    - Minimaal 1 ordinale variabele.
    - In spss kijk altijd naar de afhankelijke variabele, want die wordt beïnvloed.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q
  1. Waarom kan je nooit met zekerheid zeggen dat de ene variabele daadwerkelijk invloed heeft op een andere variabele?
  2. Wanneer is een verband spurieus/schijnverband?
  3. Welke 2 soorten spurieus verbanden heb je?
A
  1. Omdat we niet kunnen zeggen over de causaliteit, we weten namelijk niet zeker of X de oorzaak is van Y. Het kan zijn dat er een schijnverband aanwezig is (3e variabele in het spel - multivariate analyse)
  2. Spurieus=verbanddat je eerst hebt gevonden, verdwijnt door toevoeging van een derde variabele. Door toeval is er dan een verband gekomen aan het begin. Bv. In 2007 was er een fiom over Nicholas Cage, en in 2007 was de temperatuur veel warmer dan 2006 of 2008, waardoor meer mensen gingen zwemmen. Dan heeft de temperatuur effect op het aantal verdrinkingen en niet door de film van Nicholas Cage.
  3. Spurieus door:
    a) Antecedente variabele: variabele die voorafgaat aan de andere variabele. Bv. Temperatuur heeft een effect op ijsjes eten en aantal verdrinkingen. Antecedent: 3e variabele gaat vooraf aan de 2 andere variabelen (die sterk met elkaar samenhangen, maar dat niet zo is). > temperatuur gaat vooraf aan ijsjes eten en verdrinkingen. Hoe warmer het wordt, hoe meer ijsjes eten. Hoe warmer het wordt, hoe meer zwemmen en dus kans op verdrinkingen is groter.

3b) Intervenierende variabele (mediatie): variabele die er tussen komt. 3e variabele beïnvloed door 1 variabele en 3e variabel beïnvloed weer een variabele. 3e variabele=Z. Z is dan de mediator. Z
wordt beïnvloed door X en Z beïnvloedt vervolgens Y. Je oorspronkelijke verband was spurieus. X > Z > Y.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wanneer is er sprake van een interactie/specificatie?

(En derde soort multivariate analyse: Versluiering: er was eerst geen verband, met toevoeging derde variabele erbij wel een verband.)

A

Interactie/specificatie= door toevoeging van een 3e variabele wordt het effect voor sommige groepen sterker gemaakt. Er is wel een verband tussen beide variabelen (geen spurieus verband dus), alleen het verband/effect kan verschillend zijn voor verschillende groepen.

> > > Bij specificatie hanteren we de grove richtlijn van een verschil van minimaal 0.1 tussen de associaties van de verschillende groepen, en tov de bivariate associatie (oorspronkelijke sterkte van associatiemaat voordat je tabel had gesplitst). Meisjes: 0.315 en jongens: 0.320 is dan geen interactie-effect. Want het verschil tussen beide is niet (minimaal) 0.1.

VOORBEELD: Opleiding heeft effect in interesse in verkiezingen. Moderator: geslacht. Dan heb je een specificatie, specifieker gemaakt voor bepaalde groepen. Bv. Het effect van opleiding op de interesse voor de verkiezingen in de VS, kan voor mannen anders zijn dan voor vrouwen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly