DaWi 4 - Kernwissen 04 - Grundlagen der Datenanalyse Flashcards

(6 cards)

1
Q

Welche Arten von Datenanalyse kennen Sie? Nennen Sie einige Beispiele für konkrete Analyseaufgaben.

A

Deskriptive Datenanalyse:Beschreibt lediglich die Daten (z.B. graphisch) über die gesamte Datenmengez.B. Wie viel Umsatz in den jeweiligen Jahren - Säulendiagramm○

Inferenzielle Datenanalyse:Übertragung der Stichprobenbefunde auf die Grundgesamtheitz.B. Welcher %-Satz meiner potenziellen Kunden bevorzugt die Produktfarbe Blau etc.○

Explorative Datenanalyse:Datenmenge wird verarbeitet mit der Absicht, Strukturen in den Daten oder Zusammenhänge zu entdecken (Data Mining)z.B. Produkt B verkauft sich im Winter besser ○

Konfirmatorische Datenanalyse:die Überprüfung von Zusammenhängen in den Daten (z.B. Regressionsanalyse)z.B. Wer Produkt B kauft, kauft mit einer höheren Wahrscheinlichkeit auch Produkt C

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was sind Merkmale und was versteht man unter Merkmalsdimensionalität?

A

Merkmale sind Eigenschaften oder Attribute, die Objekte beschreiben. Die
Merkmalsdimensionalit‰t bezeichnet die Anzahl dieser Merkmale in einem
Datensatz.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was ist eine Stichprobe und warum benˆtige ich diese in der Praxis?

A

Eine Stichprobe ist eine representative Teilmenge einer Gesamtheit. In der Praxis benötigen wir Stichproben, um effizient, praktikabel und genau Informationen ¸über eine gröflere Population zu sammeln. Durch die Analyse von Stichproben können wir Schlussfolgerungen ¸über die Gesamtpopulation ziehen und Entscheidungen treffen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was verstehen Sie unter Anonymisierung und welche Möglichkeiten kennen Sie?

A

Formalen Anonymisierung = Direkte Identifizierungsmerkmale aus den Daten entfernen.
➔ Faktische Anonymisierung = Veranderung der Daten in der Art, dass der Aufwand zur Identifikation unverh‰ltnism‰flig hoch wird.
➔ Absolute Anonymisierung = Veranderung der Daten in der Art, dass auch komplexe mathematische Funktionen keine Identifikation ermöglichen.
➔ Möglichkeiten der Anonymisierung
o Löschen von Merkmalen
o Ersetzen von Merkmalsauspr<gungen durch Platzhalter
o Ersetzen von Merkmalen durch Pseudonyme (Bsp. Siemens -> Schönes Leben)
Frage stellen
o Aggregation von Merkmalen (Bsp. Köln -> Deutschland)
o Ersetzen durch Merkmale mit vergleichbarer Bedeutung (Opel Werk-> Produktionsstandort)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Welche statistischen Kennzahlen kennen Sie.Wann ist ihr Einsatz sinnvoll?

A

Mean Squared Error (MSE) / Mittlere Quadratische Abweichung
➔ Absolute Error (AE) / Absoluter Fehler
➔ Normalized Absolute Error / Normalisierter absoluter Fehler
➔ Relative Error (AE) / Relativer Fehler
➔ Sinnvoll bei:
o Versuchsumfangsbestimmung zur Einhaltung von Genauigkeitsvorgaben
o Konstruktion von Versuchsanlagen zur Ausschaltung von Störgrössflen
o Faktorbestimmung
o Sequentialanalyse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Erlautern Sie den Begriff statistisch signifikant in eigenen Worten.

A

Statistisch signifikant bedeutet, dass ein beobachteter Unterschied oder ein Muster in Daten wahrscheinlich nicht auf Zufall zurückzuführen ist

How well did you know this?
1
Not at all
2
3
4
5
Perfectly