Statistik 1&2 Flashcards
(56 cards)
Was bedeutet Messen in der Psychologie?
Unter Messen versteht man die Zuordnung von Zahlen zu Objekten nach bestimmten Regeln, die gewährleisten, dass bestimmte interessierende Relationen in der Menge der Objekte (empirische Relationen) in der Menge der Zahlen (nummerische Relationen) erhalten bleiben
Was ist das Eindeutigkeits-, Repräsentations-, Bedeutsamkeitsproblem?
Eindeutigkeitsproblem
- Das Eindeutigkeitsproblem stellt die Überlegung an, wie man die Zahlen im numerischen Relativ verändern (transformieren) kann, ohne dass die Strukturerhaltung gefährdet ist.
- je höher die Skala, desto weniger Transformationen zulässig
Repräsentationsproblem:
- Beschäftigt sich mit der Frage, wie ein empirisches Relativ aussehen muss, damit es homomorph durch ein nummerisches Relativ repräsentiert wird.
Bedeutsamkeitsproblem:
- Beschäftigt sich mit der Frage, welche Aussagen über Merkmalsausprägungen aufgrund der Zahlenzuordnung bedeutsam sind
Skalenniveaus: Eigenschaften, Aussagen & zulässige Transformationen
Nominal
Nominalskala
- Klassifikation von Objekten nach gleich oder ungleich
- Anforderung:
• Äquivalenzrelation
a. Reflexiv (Element steht in Relation mit sich selbst)
b. Symmetrisch (wenn u mit v in Relation steht, muss auch v mit u in Relation stehen)
c. Transitiv (wenn u mit v und v mit w in Relation steht, muss auch u mit w in Relation stehen)
- Aussagen
• Aussagen über Gleichheit und Verschiedenheit von Werten
- Transformationen
• Eineindeutige Transformationen (Unterschiedlichkeit der Werte bleibt erhalten)
• Monotone Transformationen (Rangordnung der Werte bleibt erhalten)
• Positiv lineare Transformationen (Verhältnisse zwischen Differenzen bleiben erhalten)
• Ähnlichkeitstransformationen (Verhältnisse zwischen den Werten bleiben erhalten)
• Identitätstransformationen („keine Transformation)
Skalenniveaus: Eigenschaften, Aussagen & zulässige Transformationen
Ordinal
Ordinalskala - Klassifikation & Ordnung von Objekten nach bestimmten Kriterien - Anforderung: • Strenge Ordnungsrelation a. Asymmetrisch b. Transitiv
- Aussagen
• Aussagen über Gleichheit und Verschiedenheit von Werten
• Aussagen über die Rangfolge von Werten (größer, kleiner, gleich) - Transformationen
• Monotone Transformationen (Rangordnung der Werte bleibt erhalten)
• Positiv lineare Transformationen (Verhältnisse zwischen Differenzen bleiben erhalten)
• Ähnlichkeitstransformationen (Verhältnisse zwischen den Werten bleiben erhalten)
• Identitätstransformationen („keine Transformation)
Skalenniveaus: Eigenschaften, Aussagen & zulässige Transformationen
Intervall
Intervallskala
- Klassifikation & Ordnung & Größe von Abständen von Objekten
- Aussagen
• Aussagen über Gleichheit und Verschiedenheit von Werten
• Aussagen über die Rangfolge von Werten (größer, kleiner, gleich)
• Aussagen über die Größe der Verschiedenheit von zwei Abständen
- Transformationen
• Positiv lineare Transformationen (Verhältnisse zwischen Differenzen bleiben erhalten)
• Ähnlichkeitstransformationen (Verhältnisse zwischen den Werten bleiben erhalten)
• Identitätstransformationen („keine Transformation)
Skalenniveaus: Eigenschaften, Aussagen & zulässige Transformationen
Verhältnis
Verhältnisskala
- Merkmalsausprägungen haben einen natürlichen Nullpunkt
- Aussagen
• Aussagen über Gleichheit und Verschiedenheit von Werten
• Aussagen über die Rangfolge von Werten (größer, kleiner, gleich)
• Aussagen über die Größe der Verschiedenheit von zwei Abständen
• Aussagen über das Verhältnis zweier Werte
- Transformationen
• Ähnlichkeitstransformationen (Verhältnisse zwischen den Werten bleiben erhalten)
• Identitätstransformationen („keine Transformation)
Skalenniveaus: Eigenschaften, Aussagen & zulässige Transformationen
Absolut
Absolutskala
- Merkmalsausprägungen haben einen natürliche Absolutausprägung
- Aussagen
• Aussagen über Gleichheit und Verschiedenheit von Werten
• Aussagen über die Rangfolge von Werten (größer, kleiner, gleich)
• Aussagen über die Größe der Verschiedenheit von zwei Abständen
• Aussagen über das Verhältnis zweier Werte
• Aussagen über die absolute Ausprägung eines Merkmals
- Transformationen
• Identitätstransformationen („keine Transformation“)
- Wie können Sie empirisch prüfen, ob die von Ihnen gemessene Variable den Ansprüchen an eine Ordinalskala genügt?
Durch die Bildung von paarweisen Vergleichen (vollständiger Paarvergleich )
- Es muss strenge Ordnungsrelation vorliegen, diese ist Asymmetrisch & transitiv
- Asymmetrisch= wenn u mit v in Relation, steht v nicht mit u in Relation
- Transitiv = wenn u mit v in Relation und v mit w, dann auch u mit w
Anwendung einer vorgegebenen Ordinalskala
Direkte Bildung einer Rangordnung einer Objektmenge
- Welche Aussagen über die den Merkmalsträgern zugeordneten Werte sind bei einer intervallskalierten Variablen möglich?
Aussagen über Gleichheit, Ordnung und Größe der Verschiedenartigkeit (Vergleiche von Differenzen zwischen Paaren von Merkmalsträgern)
- Zentrale Tendenz von Skalenniveaus
Nominal: Modus
Ordinal: Median (bei Antwortkategorien kann auch Modus interessant sein)
Intervall: arithmetisches Mittel, oder bei Verteilungen mit Ausreißern: Modus
Verhältnis: arithmetisches Mittel
Absolut: arithmetisches Mittel
- Beispiele Skalenniveau
Nominal: Studiengang, Geschlecht, Geburtsort, Störungsbild
Ordinal: Extraversion anhand von Likert-Skala, Schulnote, Bildungsabschluss
Intervall: Temperatur in Celsius, Intelligenz
Verhältnis: Alter, Länge, Temperatur in Kelvin, Reaktionszeit
Absolut: Anzahl an Versuchen, Anzahl der Tore in einem Fußballspiel
- Was ist Deskriptivstatistik?
Die Deskriptivstatistik dient zur Beschreibung nummerischer Daten, die in der Psychologie meist Probanden hinsichtlich ihrer Merkmalsausprägung beschreiben. Es lassen sich Aussagen über Merkmalsunterschiede und Zusammenhänge treffen
- Median, Mittelwert und Modus als Kriterium der Lageparameter. Was machen die mit der Verteilung? Nach welchem Kriterium repräsentieren sie die Verteilung? -> Vergleichen
Median:
- teilt die Verteilung in zwei gleich große Hälften, wobei jede Hälfte die gleiche Häufigkeit hat (50% sind kleiner & 50% sind größer als der Median)
- Er repräsentiert die Lage der Verteilung nach dem Kriterium der kleinsten Absolutabweichung.
- Bei Verteilungen mit Ausreißerwerten repräsentiert der Median den Mittelpunkt (die zentrale Tendenz) der Verteilung besser als der Mittelwert.
Modus
- Die Merkmalsausprägung, die am häufigsten vorkommt (die Kategorie, nicht die Häufigkeit)
- Kann nicht eindeutig bestimmt werden, wenn mehrere Kategorien gleichhäufig besetzt sind
Mittelwert /arithmetisches Mittel:
- ist der durchschnittlicher Wert, er teilt die Summe aller beobachteten Merkmalswerte durch die Anzahl der Beobachtungen
- Er repräsentiert die Lage der Verteilung nach dem Kriterium der kleinsten Quadrate.
- Sensibel für Ausreißer
- Wie kann man metrische Daten bzw. kardinalskalierte Daten in einer Verteilung darstellen? Stammblatt
- Werte werden in Stamm & Blätter zerlegt
- Die Stammbreite gibt an, wie hoch die Zahl des Stammes ist (zB Stem width 1,00 heißt, dass Stamm „6“ für den Wert 6 steht, bei 10,00 würde der Wert für 60 stehen) und dementsprechend auch die der Blätter (bei 1,00 stem width steht der Wert des Blattes für die erste Nachkomma stelle, bei 10,00 für die erste Zahl vor dem Komma)
- Die Häufigkeit gibt an, wie oft ein Stammwert aufgetreten ist, also wie viel Blätter es an diesem Stamm gibt (da zählen bei vielen Werten zu aufwändig wäre)
- Auch wird angegeben, wie viele Personen hinter einem Blatt stecken (bei each leaf 1 case hat genau eine Person den Wert 6,2 erreicht, bei zb 5 hätten 5 Personen den Wert 6,2 erreicht)
- Wie kann man metrische Daten bzw. kardinalskalierte Daten in einer Verteilung darstellen? Histogramm
Histogramm
- Zwar aussehen wie Säulendiagramm, jedoch keine Abstände zwischen den Säulen
- Breite der Säulen sinnvoll interpretierbar -> ist auf Zahlenstrahl angeordnet (Abstand bedeutsam)
- Auch Fläche sinnvoll interpretierbar; sind proportional zu absoluten und relativen Häufigkeiten -> man sieht an Flächen schnell, wie sich die Untersuchungsobjekte auf die Merkmalsausprägungsbereiche verteilen
- x-Achse: Merkmal in seinen Ausprägungsstufen (durch Kategorienbildung entstanden)
- y-Achse: Häufigkeiten, mit denen die einzelnen Messwertkategorien besetzt sind
- Wie kann man metrische Daten bzw. kardinalskalierte Daten in einer Verteilung darstellen? Polygonzug
Ist die Darstellung eines Histogramms als Linie, wobei der Ansatzpunkt der Mittelpunkt der einzelnen „Säulen“ des Histogramms ist
- Wie kann man metrische Daten bzw. kardinalskalierte Daten in einer Verteilung darstellen? Box-Plot
- Darstellung von Häufigkeitsverteilungen, in der neben dem Median als Bezugspunkte außerdem der größte und der kleinste Ausprägungswert sowie die Quartile (Viertelwerte) & Ausreißer vermerkt sind
- Median =Mittlerer Wert
- Quartile =
x Werte an Stelle n0,25 & n0,25+1 -> aufrunden
Q1 = 1/2 (x1+x2)
x Werte an Stelle n0,75 & n0,75+1
Q3 = 1/2 (x3 + x4) - Whisker
IQA= Q3 - Q1
oberer: Q3 + (1,5 * IQA) -> alles darüber ist Extremwert
unterer: Q1 - (1,5*IQA) -> alles darunter ist Extremwert
- 5 Punkte-Zusammenfassung
- x Minimum
- Q1
- Median
- Q3
- x Maximum
- Eine Darstellungsmöglichkeit für nominalskalierte Daten nennen, zeichnen und beschriften
Balken- bzw. Säulendiagramm
Kreisdiagramm
- Worin unterscheiden sich singuläre Variablen, Variablen mit Rangbindung und Variablen mit geordneten Antwortkategorien? Bei welcher Art von Messung erhalten Sie welche Art von Variable?
Bei ordinalskalierten Daten
- Singuläre Variablen sind Variablen, bei denen jeder Wert nur maximal einmal vergeben wird / vorkommt (z.B. Wettläufe)
- Variablen mit Rangbindung sind Variablen, bei denen es vorkommen kann, dass sich zwei Merkmalsträger einen Rang teilen (z.B. bei einem Wettlauf kommen zwei Personen gleichzeitig im Ziel an)
- Variablen mit geordneten Antwortkategorien: Merkmalsträger werden geordneten Kategorien zugeordnet, es gibt mehrere Merkmalsträger pro Rangkategorie
- Was wird mit Varianz gemessen? Varianz ist höher als ein anderes Merkmal. Was bedeutet das?
Streuungsmaß für metrisch skalierte Variablen
Die Varianz ist das arithmetische Mittel der quadrierten Abweichung der Messwerte vom Median mittlere quadrierte Abweichung
gibt an wie weit Werte vom Mittelwert streuen – je größer die Varianz, desto größer die Streuung
Durch die Varianz wird die Unterschiedlichkeit der Messwerte in einer Stichprobe berechnet
Wenn also die Varianz eines Merkmals höher ist, als die eines anderen, dann streuen die Werte des Merkmals stärker um den Mittelwert, sie sind heterogener als die des Merkmals mit geringerer Varianz
- Standardabweichung
Positive Quadratwurzel der Varianz
Um wie weit streuen die Werte in Skaleneinheiten
Bei Normalverteilung liegen im Bereich Mittelwert – Standardabweichung bis Mittelwert + Standardabweichung 64,2 % der Werte
- Was bringt die z-Standardisierung? Welchen Mittelwert, welche Standardabweichung haben sie?
Bei der z-Standardisierung wird die Abweichung eines Wertes zum Mittelwert an der Standardabweichung relativiert
Man kann berechnen, wie viele Standardabweichungen ein spezifischer Wert vom Mittelwert entfernt ist (eine z Einheit = eine Standardabweichung)
durch die z-Standardisierung lassen sich Ergebnisse verschiedener Studien, die mit unterschiedlichen Messinstrumenten gemessen wurden, vergleichbar machen
und Bezug zu einer Vergleichsgruppe nehmen
Verteilung z-transformierter Werte hat Mittelwert = 0, Standardabweichung = 1
- Wann wird welches Zusammenhangsmaß verwendet?
Nominal - Cramers V - Chi2 (sieht aus wie: x2) Dichotom & Dichotom - Phi – Koeffizient φ (entspricht P-M-Korrelation) - Odd-Ratio - Yules Q (entspricht Gamma-Koeffizient) Ordinal i. Ordinal Singulär - Kendalls tau (ohne Rangbindung) - Wilson e (mit Rangbindung) Ordinal & Ordinal i. Ordinal Rangklassen - Gamma Koeffizient γ Metrisch & Metrisch i. Produkt-Moment Korrelation /bravais-pearson