Statistik Flashcards
(98 cards)
Bedeutung statistischer Analysen für die Soziologie
> dient, nach der Datenerhebung, der Auswertung und Analyse der meist standardisierten Daten
> die statistische Analyse trägt dazu bei Zusammenhänge aufzudecken und zu verdeutlichen
> Statistische Analyse hat eine zusammenführende Wirkung
> Statistik in der Soziologie hat auch im Hinblick auf die Darstellung von Wissen einen hohen Stellenwert
Wo liegen die Stärken statistischer Analyse?
> hoher Verallgemeinerungsgrad
(Abbildung des großen Ganzen/Vogelperspektive)
—>verborgene Strukturen
> Zusammenführung von (begrenzten) Informationen vieler Einzelfälle
> Analyse von Trends
>
Wo liegen die Schwächen statistischer Analysen?
> durch hohe Verallgemeinerung = Vernachlässigung individueller Besonderheiten, welche wichtig für das Phänomen sind
> Fehler in erhobenen Daten —> doppelte Hermeneutik
(Interpretation des Beforschten, wenn Fragebogen)
> Statistische Ergebnisse müssen so “übersetzt” werden, dass man mit ihnen Hypothesen/Theorien/Fragen beantworten kann
Skizzieren sie die Entwicklung statistischen Wissens?
> Entstanden durch unterschiedliche Praxisfelder
> Zählbarkeit gewann im Laufe der Geschichte immer mehr an Relevanz
> Zählbarkeit brachte neue Möglichkeiten
> Institutionalisierung (Forschungseinrichtungen und akademischen Institute) sorgte für Zusammenführung und Kanonisierung des gesammelten Wissens (der Verfahren) aus den verschiedenen Praxisfeldern
> Statistik = Dynamische Wissenschaft —> ständige Entwicklung neuer Methoden, Verflechtung mit alten Methoden
> durch Dynamik gibt es verschiedene Strömungen die sich im Laufe der Zeit entwickelt haben
Skizzieren sie die historischen Entwicklungen an Hand verschiedener Anwendungsfelder statistischen Wissens.
> Koordination von Regionen eines Herrschers (mit Universitätsstatistik)
> Universitätsstatistik = Lehre ü. den Staat /
(Schwächen und Stärken, sowie Nützlichkeit für das Reich)
> Beschreibung von Ländern und Regionen (Politische Arithmetik)
> Politische Arithmetik = nur zähl & messbare Gegenstände
> Politische Arithmetik = Vorläufer der amtlichen Statistik
> Amtliche Statistik = erste Professionalisierung von statistischem Wissen
> ab dem 19. Jhd. Befasste sich unter anderem mit Volkszählung
Erläutern sie die verschiedenen Verwendungsweisen des Begriffs Statistik.
> Statistische Auswertungen bzw. das Produkt dieser wird als Statistik eines Bereiches bezeichnet.
> Auswertung und Zusammenstellung von Daten, anhand statistischer Analyse Methoden
Klären sie die Herkunft des Begriffs Statistik.
> statisdique (frz.) —> Staatswissenschaft
Systematische Beschreibung eines Staates und dessen Bevölkerung auf zahlenmäßiger Ebene.
Klären sie die Begriffe induktive und deduktive Statistik.
INDUKTIV:
> schließende Statistik
Beziehung zwischen Eigenschaften einer Stichprobe
Das Schätzen und das Testen sind die beiden Formen der schließenden Statistik
DEDUKTIVE/DESKRIPTIVE:
> Beschreibende Statistik
Ordnung und Darstellung von Daten
Gewinnung von Überblicksinformationen großer Datenmengen
Verdichtung numerischer Informationen
Erläutern sie, was ein Kodeplan ist.
> Auflistung aller verwendeten Variablen mit einer eindeutigen inhaltlichen Bedeutung der numerischen Codes
> evtl. weitere Informationen, welche sich auf den Messvorgang beziehen
Was sind Untersuchungseinheiten, Merkmale, Variablen, Merkmalsausprägungen?
UNTERSUCHUNGSEINHEITEN:
= Untersuchungsgegenstand z.B Menschen, Familien, Städte…
MERKMALE:
= Dimensionen der Untersuchungseinheiten z.B Alter, Bildungsgrad…
VARIABLEN:
= mathematischer Begriff für Merkmale
MERKMALSAUSPRÄGUNGEN:
= Ausprägung die eine Untersuchungseinheit in einer Merkmalsdimension aufweist
(Inhaltliche Ausprägung der Merkmalsdimensionen)
Erläutern sie den Begriff der Datenmatrix und legen sie dar, welche Informationen in den Zeilen, den Spalten und den Feldern der Matrix enthalten sind.
> enthält Daten über mehrere Merkmale, mehrer Personen oder Objekte und die dazugehörige Merkmalsausprägung
> ZEILEN
Untersuchungseinheit
> SPALTEN
Dimensionen der Untersuchungseinheit/ Merkmale/ Variablen
> FELDER
Merkmalsausprägung
Was versteht man im Sinne der klassischen Messtheorie unter messen?
> Versuch der Abbildung von sozialen Phänomenen im metrischen Raum
Wie hängen die Rechenregeln im numerischen Raum mit dem Messprozess zusammen?
> Symbole, Zahlen usw. dienen als Übersetzung von Beobachtungen von Phänomenen des sozialen Raums
Abstrakte Darstellungsform des sozialen Raums
Rechenregeln =≠,<>,+-,*:
Stellen sie verschiedene Skalenniveaus und die möglichen Rechenoperationen dar; geben sie Beispiele und begründen diese.
NOMINAL :
>gleich oder ungleich
> z.B Religion, Wohnort
> f(x)=f(y), f(x)≠(y)
ORDINAL:
>gleich oder ungleich, kleiner oder größer
> z.B Schulabschluss, Noten
> f(x)>f(y), f(x)gleich oder ungleich, kleiner oder größer, Abstand des Grrößenunterschieds
> z.B IQ
>f(x)-f(y)>_f(w)-f(z)
Intervall
RATIO:
>gleich o. ungleich, kleiner o. größer, Abstand des Größenunterschieds, Beziehung des Größenunterschieds —> Verhältnisaussagen
> z.B doppelt, halb so viel Einkommen
>f(x)=a*f(y)
Was ist eine dichotome Variable?
> ordinal oder nominal skaliertes Merkmal
> lediglich ZWEI Ausprägungen
(JA o. NEIN)
Was sind diskrete und stetige Daten?
STETIG
> metrisch skaliert
> innerhalb eines Intervalls unendlich viele Ausprägungen, weil immer Zwischenwerte vorliegen (Körpergröße)
DISKRET
> metrisch skaliert
> nimmt nur einzelne Zahlenwerte an (Alter in Jahren)
Diskutieren Sie das Problem, auf welchem Skalenniveau das Ergebnis einer Einstellungsfrage, zu der in der Abstufungen eher zustimmend oder eher ablehnend Stellung genommen wird, anzusiedeln ist.
> eher ordinal (oder eventuell metrisch diskret), weil die Größe des Abstands nicht definierbar ist.
Man kann keine Aussage über die “gefühlten” Abstände machen
Schwer vergleichbar
Erläutern Sie an diesem Beispiel Eigenschaften des arithmetischen Mittels und des Medians
ARITHMETISCHES MITTEL: > wird auch Durchschnitt genannt > Voraussetzung: metrisch skaliert > stärker durch Extremwerte beeinflusst, kein Informationsverlust >Nachteil: Verzerrung
MEDIAN:
> der Wert der in der Mitte steht, wenn die Messwerte der Größe nach geordnet sind
> Voraussetzung: ordinal oder metrisch skaliert
>
Was spricht dafür/dagegen bei einer repräsentativen Stichprobe den Einkommensmedian bzw. das arithmetische Mittel des Einkommens zu verwenden?
MEDIAN:
>Informationsverlust
(Nicht so sehr vom Extremwert abhängig, zeigt an auf welchen Wertebereich Verteilung konzentriert ist
ARITHMETISCHES MITTEL:
> stärker durch Extremwerte beeinflusst, dadurch kein Informationsverlust
Nachteil: Verzerrung —> kein Schluss darauf, zB. Wie groß die Mehrheit ist/ wie viel die “Allgemeinheit” verdient
In welcher Beziehung stehen Median und ar. Mittel in einer links/rechtssteilen Verteilung?
> eine Verteilung von Messwerten wird als schief bezeichnet wenn sie in der Weise asymmetrisch ist, dass links oder rechts des Durchschnitts eine Häufung der Messwerte auftritt
Stellen Sie verschiedene Maßzahlen zur Beschreibung von Streuungen dar und beschreiben sie ihre Eigenschaften.
Streuung beschreibt Abweichung der Werte einer Verteilung vom Mittelwert.
> Range (Spannweite)
Maximaler Wert minus Minimaler Wert, nur Extremwerte
> Quartilsabstand:
Q3-Q1, 50 % der Fälle, Fokus auf mittlere Werte, keine Ausreißer
> Quantilsverhältnisse:
z.B. Q90/Q10, Rand der Verteilung ohne Ausreißer
> Durschnittliche Abweichung vom arithm. Mittel:
Summe der absoluten Abweichung vom Mittelwert jedes Falles durch die Fallzahl
> Varianz
Das gleiche wie, nur mit quadriertem Abständen, anfälliger für große Abstände
Summe der quadrierter Abstände = Variation
> Standardabweichung
= Wurzel der Varianz (s)
Gibt Auskunft über die Aussagekraft des Mittelwerts
Was ist ein Varianzkoeffizient und wozu dient er?
> Setzt die Standartabweichung in Verhältnis zu Mittelwert
(s/xquer), um Steuungen vergleichbar zu machen
Beschreiben Sie, welche Eigenschaften von Verteilungen mit Konzentrationsmaßen erfasst werden können.
> Wie ist die Summe der Merkmalsausprägungen auf UEs verteilt?
Was unterscheidet Streuungs- und Konzentrationsmaße?
Streuung:
wie verteilen sich UEs auf verschiedne Merkmalsausprägungen und wie stark weichen sie vom Mittelwert ab
Konzentration:
Wie ist die Summe der Merkmalsausprägungen auf EUs verteilt