Methoden der Statistik SS23 Flashcards

(73 cards)

1
Q

Wie erstellt man ein Stabdiagramm von relativer Häufigkeit?

A

plot (h.i)

Schöner:
plot(h.i,main=“Stabdiagramm Mathekenntnisse“,ylab = “rel. Häufigkeiten“ , xlab=“bescheiden<––Selbsteinschätzung——>sehr gut“)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wie kann man zwei Gruppen miteinander vergleichen und graphisch darstellen?

A

zwei Variablen

Mit dem boxplot Befehl:

Beispiel:
#eine Variante
boxplot ( daten$BUDGET, horizontal=T)

boxplot(GRO~GESCHL, data=daten, horizontal=T)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

~ steht für?

A

Steht in R für die Gegenüberstellung bzw. den Vergleich zweier Variablen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wie kann man den Zusammenhang der Variablen anhand eines Streidiagramms darstellen?

A
  • Standardbefehl plot liefert bei Angabe von zwei Vektoren ein Streudiagramm
    Beispiel:
    #Variante 1
    plot (daten$flaeche,daten$miete,col= alpha (“ skyblue4“,0.2), pch=16)
    #Variante 2
    plot (flaeche, miete, data= daten, col= alpha (“skyblue4 “,o.2),pch=16)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wie erstellt man ein Histogramm?

A

Daten einlesen

daten<–read.csv 2(“Umfrage.csv“)

hist(daten$GEW, freq=F, xlab=“Gewicht in kg“, ylab=“Häufigkeitsdichte “,main = “Histogramm“,breaks=20)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Mit welchem Zeichen findet die Zuordnung, Summe, Division, und Mulltiplikation im RStudio statt?

A

a<—2 a wird in Liste Wert 2 zugeordnet
b<– a+2 b wird a+2=4 zugeordnet
3/0 geteilt
2*3 mal

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wie erstellt man einen Vektor zahlen, der alle Zahlen 1 bis 5 enthält?

A

zahlen<–1:5

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wie erstellt man eine Häufigkeitstabelle mit n.i, h.i., F.i und ein Stabdiagramm?

A

Datensatz einlesen danach working Directory setzen

daten<–read.csv2(“Umfrage.csv“)

n.i<–table(daten$MATHE)
#rel.Häufigkeiten
h.i<–n.i/length (daten$MATHE)
#rel. kumulative Häufigkeiten
F.i cumsum (h.i)
htab<–cbind (n.i,h.i,F.i)
htab
plot (h.i , main = “Überschrift“,ylab=“rel.Häufigkeiten,xlab=“ bescheiden bis sehr gut“

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wie liest und listet man einen Datensatz?

A

daten<–read.csv2(“Umfrage.csv“)
str(daten) / head (daten)

Bedeutung: str (daten) Überblick welche Variablen
head(daten) erste 6 Zeilen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Diskrete und stetige Merkmale

A

Diskretes Merkmal: zwischen beliebigen Werten gibt es eine zählbare Anzahl der Werte , z.B. Anzahl der Bevölkerung, Alter

Stetiges Merkmal: Die Anzahl der Ausprägungen ist überabzählbar. D.h. alle Werte eines Intervalls sind möglich, z.B Temperatur in °C, °F.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Relative und kumulierte Häufigkeiten

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Zeichnen sie eine Häufigkeitstabelle

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Arithmetischer Mittel

A

-anfällig für Aussreisser

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Transformationssatz

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quantile

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Spezielle Quantile

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Boxplot

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Arithmetisches Mittel

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Median

A

-nicht anfällig für Aussreiser

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Eigenschaften arithmetischen Mittels

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Arithmetischer Mittel berechnen

A

-mithilfe des arithmetischen Mittels berechnet man den Durchschnitt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Berechnen Sie die Dezile aus dem vorliegenden Datensatz.

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Für das Merkmal “Größe” ist anzunehmen, dass die Verteilung bei Frauen und Männern unterschiedlich ausfällt. Erzeugen Sie zwei neue Variablen “GROm” (für die Größe der Männer) und “GROf” (für die Größe der Frauen).

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Wie groß sind die männlichen Vorlesungsbesucher im Durchschnitt? Berechnen Sie die durchschnittliche Größe anschließend für die weiblichen Studierenden aus der Veranstaltung.
26
Die Werte in der Variablen “GRO” haben die Einheit Zentimeter. Erzeugen Sie eine neue Variable “GROmeter”, in der die Größe in Metern gespeichert ist.
27
Wie viele Telefonate hat der Nutzer geführt? Wie lange haben das längste bzw. das kürzeste Gespräch gedauert?
28
1)Berechnung der durchschnittlichen absoluten Abweichung 2) Berechnung der Varianz 3) Berechnung der Standardabweichung
29
d) Berechnen Sie die Standardabweichung der Gesprächsdauer. Kennen Sie andere Streuungs- maße? Berechnen Sie zwei davon.
30
Üblicherweise sind die Tarife für Auslandsgespräche höher als für Inlandsgespräche. Erzeugen Sie zwei neue Variablen “bin” (Abkürzung für “Betrag und Inland”) und “baus” (Abkürzung für “Betrag und Ausland”).
31
Vergleichen Sie die Mittelwerte und die Standardabweichungen der Kosten für Inlands- und Auslandsgespräche
32
Streuungsparameter
33
Metrische Skala
34
Ordinalskala
35
Nominalskala
36
Stabdiagramm mit rel. Wahrscheinlichkeit und empirische Verteilungsfunktion nebeneinander
37
Statistisches Merkmal
38
Empirische Verteilungsfunktion
39
Wie erzeugt man eine empirische Verteilungsfunktion?
40
Berechnen des Medians ungerade
41
Berechnen des Medians Gerade
42
Frage: Besteht ein Zusammenhang zwischen Wohnsituation der Studierenden und Geschlecht
43
Kontingenztafel
44
Kontingenztafel mit relativen Häugkeiten:
45
Zusammenhangsmaÿe für metrisch skalierte Merkmale
46
Bivariante Häufigkeitsverteilungen
47
Zusammenhänge Kovarianz
48
Empirische Kovarianz
- Zusammenhangsmass zweier Variablen - Anzahl der Beobachtungen - n Anzahl Beobachtungen - x Strich und y Strich sind die jeweiligen arithmetischem Mittel
49
Empirische Kovarianz im Rstudio
50
Empirischer Korellationskoeffizient
51
a) Importieren Sie den Datensatz UmfrageWiSe2223.csv in ein neues R-Skript.
52
Berechnen Sie die Kovarianz
53
Korrelationskoeffizient nach Pearson
-bestimmt Zusammenhang zweier Variablen -Pearson-Korrelationskoeffizient r r E (-1;+1) 1: perfekt positiver Zusammenhang -1:perfekt negativer Zusammenhang r=kein „linearer“ Zusammenhang TIPP: Tabellenschreibweise sehr hilfreich
54
Korrelationskoeffizient nach Spearman
- gut für ordinal und Kardinal skalierte Variable -Zusammenhang zwischen Variablen -Interpretation ähnlich zu Pearson
55
Scheinkorrelation
56
Ergebnismenge E eines Zufallsexperiments
57
Mengenoperation
58
Mengenoperation
59
Mengenoperation
60
Folgerungen aus den Axiomen 1 bis 3
61
Konstruktion von Wahrscheinlichkeiten
62
Fall a) Konstruktion von Wahrscheinlichkeitsmaÿen
63
Fall b) Konstruktion von Wahrscheinlichkeitsmaÿen
64
Fall c) Konstruktion von Wahrscheinlichkeitsmaÿen
65
66
Bedingte Wahrscheinlichkeit
67
Satz von Bayes
68
Disjunkte Vereinigungsmenge
Vereinigungsmenge ohne Schnittmenge
69
Satz der totalen Wahrscheinlichkeit
70
Stochastische Unabhängigkeit von Ereignissen
71
Zufallszahlen R Studio
72
Zufallsvariablen
73
Diskret und stetige Zufallsvariablen