Statistik - Auffrischung Flashcards Preview

Statistik > Statistik - Auffrischung > Flashcards

Flashcards in Statistik - Auffrischung Deck (31)
Loading flashcards...
1

Lageparameter

- Ein Lageparameter beschreibt das Zentrum der Daten

2

Mittelungszahlen

- Orientierung der Maßzahlen am Mittelwert

3

Arithmetischer Mittelwert

- Durchschnitt aller Werte in der Stichprobe = Schwerpunkt der Daten

Zum Beispiel ist das arithmetische Mittel der beiden Zahlen 1 und 2:

x=1+2/2= 1,5

4

Median

- Wert, der in der Mitte der geordneten Stichprobe liegt
- FĂŒr streng symmetrische Verteilungen sind Median und Mittelwert gleich

x(n+1)/2 falls n ungerade ist
median(x)=
1/2(xn/2+x(n/2)+1) falls n gerade ist

5

Geometrischer Mittelwert

- Nicht fĂŒr alle Verteilungen sinnvoll
- Verlangt ausschließlich positive Werte in der Verteilung

6

Modus

- Der Modus ist die hÀufigste vorkommende AusprÀgung der x-Werte

7

Bernoulli

- FĂŒr jeden Versuch gibt es nur 2 AusgĂ€nge
- Wahrscheinlichkeiten bleiben bei jedem Durchgang gleich
- Einzelnen DurchfĂŒhrungen sind unabhĂ€ngig voneinander

> Das ''ob'' oder ''ob nicht'' Experiment:

p fĂŒr x=1 (p= Wahrscheinlichkeit eintreffen)
f(x)=
q=1-p fĂŒr x=o (Wahrscheinlichkeit nicht einftreffen)

8

Das Modell und die beiden Hypothesen

- Das Grundmodell ist die PrÀzisierung des nicht bezweifelten Vorwissens
- Die Nullhypothese H0 ist die PrĂ€zisierung der angezweifelten Aussage, ĂŒber deren richtigkeit eine Entscheidung zu fĂ€llen ist
- Die Alternativhypothese H1 sagt: Was gilt, wenn H0 falsch ist?

9

Klassenbreite K (in Histogramm)

- ist ein wichtiger Parameter des Histogramms um die theoretische Verteilung zu schÀtzen

10

Was stellen 2 Funktionen dar?

- Stellen ein Strukturierungselement in einer Programmiersprache dar

11

Wie sind der Mittelwert und die Standardabweichung einer Standardnormalverteilung definiert?

- Die Standardabweichung ist die durchschnittliche quadratische Abweichung vom Mittelwert (Formel)

12

Was bezeichnet die FlÀche unter der Wahrscheinlichkeitsdichtefunktion?

- Die FlÀche unter der Wahrscheinlichkeitsdichtefunktion entspricht der Wahrscheinlichkeit eines Wertes zwischen einem Punkt a und einem Punkt b auf der x-Achse

13

Warum Skript falsch?

- for-Schleife falsch: i=0:1:n,
0-Vektor kann nicht dargestellt werden

Lösung: i=1:1:n

14

Schleifen

- Schleifen werden benötigt, um einen Codeblock (=''Schleifenkörper'') wiederholt auszufĂŒhren

15

Fibonacci-Folge

- Unendliche Folge von Zahlen (den Fibonaccizahlen), bei der sich die jeweils folgende Zahl durch Addition ihrer beiden vorherigen Zahlen ergibt:

0,1,1,2,3,5,8,13,21,....

16

Histogramm

- Ein Histogramm ist eine graphische ReprÀsentation einer Verteilung numerischer Daten
> Rechtecke mit der gleichen Breite haben Höhen, die den zugehörigen Frequenzen entsprechen

17

HĂ€ufigkeitsverteilung

- HĂ€ufigkeit des Auftretens bestimmter Ereignisse
- Werte nur bei diskretem Wertebereich
- sinnvolle Klassenbildung

18

Auswahl der Klassen

- Klassen mĂŒssen den Wertebereich ĂŒbertreffen
- Untergrenze der 1. Klasse = Untergrenze des Wertebereichs
- Obergrenze der letzten Klasse = Obergrenze des Wertebereichs

- Klassen sollen im Allgemeinen gleich groß sein!

19

AbschÀtzung

- Die Genauigkeit der AbschÀtzung hÀngt von der Verteilung der Daten innerhalb der Klassen ab
- Bei symmetrischer Verteilung innerhalb jeder Klasse ist die NĂ€herung exakt

20

Funktionen

- Funktionen werden eingesetzt um mathematische Funktionen in Algorithmen umzusetzen
- ohne Funktionen kann man nur Code kopieren und einfĂŒgen
- Benutztung erhöht die VerstÀndlichkeit und QualitÀt eines Prgrammes/Skriptes
-geringere Kosten und Wartungen fĂŒr Software

21

Binominalverteilung

- Untersucht, wie hoch die Wahrscheinlichkeit fĂŒr einen positiven Ausgang bei mehrmaliger Wiederholung des Experiments ist, wenn man nach jedem Versuch das gezogene Element zurĂŒck legt

22

Regression

- Bestimmung des funktionalen Zusammenhangs
- Minimierung der Summe der Fehlerquadrate
- Man braucht eine quantitative Analyse der Daten um die beste Tendenz zu finden

y=f(x1,x2,x3,...)

23

Lineare Regression

y=f(x)=ax+b
y:abhÀngige Daten, x:unabhÀngige Daten, b:Achsenabschnitt, a:Geradenanstieg

- FĂŒr eine lineare 2D-Regression, sucht man die ''beste'' Beschreibung experimenteller x-y Daten
> Die besten a und b Parameter sind die Parameter, welche die Summe der Fehlerquadrate minimalisieren!

24

Streuungsparameter

- geben an, wie die AusprÀgung um das ''Zentrum'' streuen

25

Variationsmasse

- Maßzahlen zur Kennzeichnung der Datenvariationen

26

Histogramm

- ist eine graphische Darstellung der Stichproben, aber auch die Verbindung der vollstÀndigen Darstellungen der Daten und der Vergleich mit den theoretischen Verteilungen, aber... Das Histogramm besteht von vornerein aus Klassenbezogenen Daten

27

Das ''Kopf-Zahl'' Experiment

- Nur 2 mögliche Ergebnisse: ''Kopf'' oder ''Zahl''
> ''1'' oder ''0''. Die Wahrscheinlichkeit, dass ein ''Kopf'' erscheint, ist 0,5

28

Korrelation

- Bestimmung der GĂŒte des Zusammenhangs

29

Testen von Hypothesen-Grundlagen

- Das Testen von Hypothesen gibt uns eine Richtlinie in die Hand fĂŒr die Wahl zwischen Alternativen, indem der Fehler, der mit einer Entscheidung verknĂŒpft ist, korrigiert oder minimiert wird

30

Fehlerarten

- Fehler 1. Art (Alpha-Fehler): treten auf, wenn wir die Nullhypothese verwerfen, obwohl sie richtig ist

- Fehler 2. Art (Beta-Fehler): treten auf, wenn die Nullhypothese akzeptiert wird,obwohl die Alternativhypothese akzeptiert wird