Statistik - Auffrischung Flashcards
(31 cards)
Lageparameter
- Ein Lageparameter beschreibt das Zentrum der Daten
Mittelungszahlen
- Orientierung der Maßzahlen am Mittelwert
Arithmetischer Mittelwert
- Durchschnitt aller Werte in der Stichprobe = Schwerpunkt der Daten
Zum Beispiel ist das arithmetische Mittel der beiden Zahlen 1 und 2:
x=1+2/2= 1,5
Median
- Wert, der in der Mitte der geordneten Stichprobe liegt
- Für streng symmetrische Verteilungen sind Median und Mittelwert gleich
x(n+1)/2 falls n ungerade ist median(x)= 1/2(xn/2+x(n/2)+1) falls n gerade ist
Geometrischer Mittelwert
- Nicht für alle Verteilungen sinnvoll
- Verlangt ausschließlich positive Werte in der Verteilung
Modus
- Der Modus ist die häufigste vorkommende Ausprägung der x-Werte
Bernoulli
- Für jeden Versuch gibt es nur 2 Ausgänge
- Wahrscheinlichkeiten bleiben bei jedem Durchgang gleich
- Einzelnen Durchführungen sind unabhängig voneinander
> Das ‘‘ob’’ oder ‘‘ob nicht’’ Experiment:
p für x=1 (p= Wahrscheinlichkeit eintreffen) f(x)= q=1-p für x=o (Wahrscheinlichkeit nicht einftreffen)
Das Modell und die beiden Hypothesen
- Das Grundmodell ist die Präzisierung des nicht bezweifelten Vorwissens
- Die Nullhypothese H0 ist die Präzisierung der angezweifelten Aussage, über deren richtigkeit eine Entscheidung zu fällen ist
- Die Alternativhypothese H1 sagt: Was gilt, wenn H0 falsch ist?
Klassenbreite K (in Histogramm)
- ist ein wichtiger Parameter des Histogramms um die theoretische Verteilung zu schätzen
Was stellen 2 Funktionen dar?
- Stellen ein Strukturierungselement in einer Programmiersprache dar
Wie sind der Mittelwert und die Standardabweichung einer Standardnormalverteilung definiert?
- Die Standardabweichung ist die durchschnittliche quadratische Abweichung vom Mittelwert (Formel)
Was bezeichnet die Fläche unter der Wahrscheinlichkeitsdichtefunktion?
- Die Fläche unter der Wahrscheinlichkeitsdichtefunktion entspricht der Wahrscheinlichkeit eines Wertes zwischen einem Punkt a und einem Punkt b auf der x-Achse
Warum Skript falsch?
- for-Schleife falsch: i=0:1:n,
0-Vektor kann nicht dargestellt werden
Lösung: i=1:1:n
Schleifen
- Schleifen werden benötigt, um einen Codeblock (=’‘Schleifenkörper’’) wiederholt auszuführen
Fibonacci-Folge
- Unendliche Folge von Zahlen (den Fibonaccizahlen), bei der sich die jeweils folgende Zahl durch Addition ihrer beiden vorherigen Zahlen ergibt:
0,1,1,2,3,5,8,13,21,….
Histogramm
- Ein Histogramm ist eine graphische Repräsentation einer Verteilung numerischer Daten
> Rechtecke mit der gleichen Breite haben Höhen, die den zugehörigen Frequenzen entsprechen
Häufigkeitsverteilung
- Häufigkeit des Auftretens bestimmter Ereignisse
- Werte nur bei diskretem Wertebereich
- sinnvolle Klassenbildung
Auswahl der Klassen
- Klassen müssen den Wertebereich übertreffen
- Untergrenze der 1. Klasse = Untergrenze des Wertebereichs
- Obergrenze der letzten Klasse = Obergrenze des Wertebereichs
- Klassen sollen im Allgemeinen gleich groß sein!
Abschätzung
- Die Genauigkeit der Abschätzung hängt von der Verteilung der Daten innerhalb der Klassen ab
- Bei symmetrischer Verteilung innerhalb jeder Klasse ist die Näherung exakt
Funktionen
- Funktionen werden eingesetzt um mathematische Funktionen in Algorithmen umzusetzen
- ohne Funktionen kann man nur Code kopieren und einfügen
- Benutztung erhöht die Verständlichkeit und Qualität eines Prgrammes/Skriptes
- geringere Kosten und Wartungen für Software
Binominalverteilung
- Untersucht, wie hoch die Wahrscheinlichkeit für einen positiven Ausgang bei mehrmaliger Wiederholung des Experiments ist, wenn man nach jedem Versuch das gezogene Element zurück legt
Regression
- Bestimmung des funktionalen Zusammenhangs
- Minimierung der Summe der Fehlerquadrate
- Man braucht eine quantitative Analyse der Daten um die beste Tendenz zu finden
y=f(x1,x2,x3,…)
Lineare Regression
y=f(x)=ax+b
y:abhängige Daten, x:unabhängige Daten, b:Achsenabschnitt, a:Geradenanstieg
- Für eine lineare 2D-Regression, sucht man die ‘‘beste’’ Beschreibung experimenteller x-y Daten
> Die besten a und b Parameter sind die Parameter, welche die Summe der Fehlerquadrate minimalisieren!
Streuungsparameter
- geben an, wie die Ausprägung um das ‘‘Zentrum’’ streuen