Datenanalyse Flashcards

(27 cards)

1
Q

Welche sind die 2 Arten von Statistik?

A
Deskriptive (beschreibende)
Und Inverenzstatistik (schlissfolgende)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was ist deskriptive Statistik?

A

Das ist beschreibende Statistik. Sie liefert eine Zusammenfassung von Daten. Maße werden zur Beschreibung von Datenmengen benutzt, die am häufigsten erhonen werden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was ist Inverenzstatistik?

A

Sie gibt Aufschluss darüber, welche Schlüsse (Inferenzen) aus der Stichproben ableitbar sind und welche Schlussfolgerungen man legitimerweise aus den Daten ziehen kann. Sie verwendet die Wahrscheinlichkeitstheorie, um festzustellen, wie wahrscheinlich es ist, dass ein Datensatz durch Zufall entstanden ist.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Welche sind die Deskriptive Maßen?

A

Haüfigkeitsverteilung; Maße der zentralen Tendenz - Modalwet, Median, ar. Mittel; Maße der Variabilität - Spannungsweite u.Standartabweichung; Korrelation- Korrealationskoeffizient.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was ist Häufigkeitsverteilung?

A

Die Häufigkeitsverteilung ist die Zusammenfassung, wie häufig ein Wert in einer Menge von Werten auftritt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Schritte für Häufigkeitsverteilung?

A
  • Der erste Schritt zu einer Häufigkeitsverteilung der Daten ist es, eine Rangordnung der Werte vom höchsten zum niedrigsten zu erstellen.
  • Ein zweiter Schritt ist die Gruppierung dieser nach Rängen geordneten Daten zu einer kleineren Zahl von Kategorien, die man als Intervalle bezeichnet.
  • Im dritten Schritt wird eine tabellarische Häufigkeitsverteilung erstellt, indem man die Intervalle vom obersten zum untersten auflistet und die jeweilige Häufigkeit, also die Anzahl innerhalb jedes Intervalls, angibt.
  • Der nächste Schritt ist die grafische Darstellung der Verteilung
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was ist Häufigkeit?

A

Anzahl der Werte innerhalb jenes Intervalls

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Welche Diagramme gibt es?

A

Die einfachste Diagrammform ist ein Balkendiagramm. Sie ermöglichen es, Muster in den Daten zu erkennen.

  • Für komplexere Daten kann man ein Histogramm nehmen. Es ähnelt einem Balkendiagramm, allerdings erfordert es die Einteilung der Daten in Klassen bzw. Kategorien.
  • Ein Histogramm vermittelt einen visuellen Eindruck der Anzahl von Werten in einer Verteilung, die in jedem der Intervalle liegt.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Welche sind die 3 Maßen der zentrallen Tendenz?

A

Modalwert, Median u aristetische Mittel

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was ist Modalwert?

A

Der Modalwerd ist einfach der Wert, der am Öftesten vorkommt.Er ist das Maß der zentralen Tendenz, das am leichtesten zu erheben ist, aber oft auch das am wenigsten nützliche.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was ist Median?

A

.-Der Median eignet sich eher als zentraler Wert. Er trennt die obere und untere Hälfte symmetrisch. Es gibt genauso viele Werte die größer sind als der Median, wie es Werte gibt, die kleiner sind.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was ist aristetisches Mittel?

A
  • Das arithmetische Mittel ist der Wert, an den die meisten Menschen denken, wenn von Mittelwert oder Durchschnitt die Rede ist. Es ist außerdem der statistische Kennwert, der am häufigsten zur Beschreibung eines Datensatzes verwendet wird
  • Um dies zu bestimmen, addiert man alle Werte einer Verteilung auf und teilt die Summe durch die Gesamtanzahl der Werte.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Warum ist aritmetisches Mitterl besser als Median?

A

Im Gegensatz zum Median wird das arithmetische Mittel durch die konkreten Werte aller Testwerte in einer Verteilung beeinflusst. Eine Veränderung eines Extremwertes verändert den Wert des arithmetischen Mittels

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wie findet man das Meridian bei geraden u. ungeraden Zahlen?

A

-Bei einer ungeraden Zahl von Werten ist der Median der mittlere Wert. Bei einer geraden Anzahl von Werten muss man oft einen Mittelwert aus den beiden mittleren Werten bilden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was ist Masse der Variabilitaet?

A

. Maße der Variabilität sind statistische Maße, welche die Verteilung von Werten um ein Maß der zentralen Tendenz beschreiben

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

warum braucht man Masse der Variabilitaet?

A

Es wird gezeigt, inwieweit die individuellen Ergebnisse von der zentralen Tendenz abweichen

17
Q

welche arten von Masse der Variabilitaet gibt es?

A

die Spannweite, die Standardabweichung/SD

18
Q

was ist die Spannweite?

A

Das einfachsten Maß der Variabilität ist die Spannweite, die Differenz zwischen dem höchsten und dem niedrigsten Wert in einer Häufigkeitsverteilung.

-Man benötigt für die Berechnung der Spannweite nur zwei Werte, den höchsten und den niedrigsten.

19
Q

Was ist die Standartabweichung?

A

-Ein häufig verwendetes Maß ist die Standardabweichung/SD, ein Maß der Variabilität, das die mittlere Differenz zwischen den Werten und ihrem arithmetischen Mittel widerspiegelt.

20
Q

Wie berechnet man die Standartabweichung?

A
  • Um die SD einer Verteilung zu ermitteln, muss man das arithmetische Mittel der Verteilung und die einzelnen Werte X kennen.
  • Der Ausdruck X-M bedeutet einzelner Test wert minus arithmetisches Mittel und wird allgemein als Abweichungswert bezeichnet
21
Q

was gibt die Standartabweichung an? Was bedeutet grosse u. kleine SD?

A

Die SD gibt an, wie variabel eine Menge von Werten ist. Je größer die SD, desto breiter gestreut sind die Werte

-Eine kleine SD bedeutet, dass das arithmetische Mittel ein guter repräsentativer Index für die gesamte Verteilung ist. Ist die SD groß, ist das arithmetische Mittel weniger typisch für die gesamte Gruppe.

22
Q

was bedeutet Korrelation?

A

erfasst wie stark u. von welcher Art die beziehung zw 2 Variablen ist. Gibt an , in wiefern Wert einer Variablen mit den Werten einer anderen zusammenhaengen.

23
Q

Was sind die 3 Arten von Korrelation und was bedeuten sie?

A
  • +1 positive Korrelation, bedeutet, dass wenn der eine Wert steigt, der andere auch steigt. Wenn hohe Werte bei einer Variable in der Regel auch hohe Werten bei anderen Variablen haben.
  • 0 bedeutet es besteht keine Korrelation - keine symetrische Beziehung zw den Werten gibt
  • 1 negative Korrelation, bedeutet, dass wenn der eine Wert steigt, der andere sinkt. Wenn hohe Werte bei einer Variable in der Regel niedrige Werten bei anderen Variablen haben
  • Der Korrelationskoeffizient „r“: nimmt eben einen Wert zwischen (+1) und (-1) an, z.B. 0,68. Je näher r an entweder +1 oder -1 ist, desto aussagekräftiger ist er. zB ist +0,5 aussagekräftiger als -0,1.
24
Q

Was ist Inferenzstatistk?

A

.-Sie gibt Aufschluss darüber, welche Schlüsse/Inferenzen aus den Stichproben ableitbar sind und welche Schlussfolgerungen man legitimer weise aus den Daten ziehen kann.

  • Die Inferenzstatistik verwendet die Wahrscheinlichkeitstheorie, um fundierte Entscheidungen darüber zu treffen, welche Ereignisse lediglich die Folge zufälliger Variation sein könnten.
  • Diese sagt uns, inwieweit Daten und Ergebnisse vom Zufall stammen, ob sie relevant sind, etc.
25
Was ist Normaverteilung?
.-Die Verteilung ist symmetrisch und glockenförmig und wird auch Gauß’sche Glocke genannt, jede Verteilung folgt dieser Kurve (Glocke). - Bei einer Normalverteilung sind Median, Modalwert und arithmetisches Mittel identisch. Man kann vorhersagen, dass ein bestimmter Prozentsatz an Werten in unterschiedliche Abschnitte der Verteilung fällt. - Die Normalverteilung gibt Auskunft darüber, wie verbreitet oder selten eine bestimmte Ausprägung ist. - man erhält auch dann eine Normalverteilung wenn man eine Reihe von Messungen macht, deren Unterschiede nur auf den Zufall zurückzuführen sind
26
Was ist statistische Signifikant?
.Da der Zufall regelmäßig verteilt ist, können Forschende bei dieser Frage auf die Normalverteilung zurückgreifen. - Innerhalb der Psychologie hat man sich geeinigt, einen Unterschied als bedeutsam einzustufen, wenn die Wahrscheinlichkeit, dass er durch Zufall zustande gekommen ist, weniger als 5 von 100 beträgt, man notiert dies als p<0.05. Ein signifikanter Unterschied ist ein Unterschied, der dieses Kriterium erfüllt. - Anhand eines statistisch signifikanten Unterschieds können Forscher Schlussfolgerungen über das untersuchte Verhalten ziehen.
27
Was ist t-Test?
Den T-Test setzt man ein, wenn man wissen möchte, ob der Unterschied zwischen den arithmetischen Mitteln zweier Gruppen statistisch signifikant ist. - Ein t-Test benutzt mathematische Verfahren, um die Schlussfolgerung zu bestätigen. - In der Wissenschaft ist die Wahrheit provisorisch, immer offen für eine Revision durch später erhobene Daten aus besseren Untersuchungen, die aufgrund besserer Hypothesen entwickelt wurden.