DaWi 4 - Kernwissen 04 - Grundlagen der Datenanalyse Flashcards
(6 cards)
Welche Arten von Datenanalyse kennen Sie? Nennen Sie einige Beispiele für konkrete Analyseaufgaben.
Deskriptive Datenanalyse:Beschreibt lediglich die Daten (z.B. graphisch) über die gesamte Datenmengez.B. Wie viel Umsatz in den jeweiligen Jahren - Säulendiagramm○
Inferenzielle Datenanalyse:Übertragung der Stichprobenbefunde auf die Grundgesamtheitz.B. Welcher %-Satz meiner potenziellen Kunden bevorzugt die Produktfarbe Blau etc.○
Explorative Datenanalyse:Datenmenge wird verarbeitet mit der Absicht, Strukturen in den Daten oder Zusammenhänge zu entdecken (Data Mining)z.B. Produkt B verkauft sich im Winter besser ○
Konfirmatorische Datenanalyse:die Überprüfung von Zusammenhängen in den Daten (z.B. Regressionsanalyse)z.B. Wer Produkt B kauft, kauft mit einer höheren Wahrscheinlichkeit auch Produkt C
Was sind Merkmale und was versteht man unter Merkmalsdimensionalität?
Merkmale sind Eigenschaften oder Attribute, die Objekte beschreiben. Die
Merkmalsdimensionalit‰t bezeichnet die Anzahl dieser Merkmale in einem
Datensatz.
Was ist eine Stichprobe und warum benˆtige ich diese in der Praxis?
Eine Stichprobe ist eine representative Teilmenge einer Gesamtheit. In der Praxis benötigen wir Stichproben, um effizient, praktikabel und genau Informationen ¸über eine gröflere Population zu sammeln. Durch die Analyse von Stichproben können wir Schlussfolgerungen ¸über die Gesamtpopulation ziehen und Entscheidungen treffen
Was verstehen Sie unter Anonymisierung und welche Möglichkeiten kennen Sie?
Formalen Anonymisierung = Direkte Identifizierungsmerkmale aus den Daten entfernen.
➔ Faktische Anonymisierung = Veranderung der Daten in der Art, dass der Aufwand zur Identifikation unverh‰ltnism‰flig hoch wird.
➔ Absolute Anonymisierung = Veranderung der Daten in der Art, dass auch komplexe mathematische Funktionen keine Identifikation ermöglichen.
➔ Möglichkeiten der Anonymisierung
o Löschen von Merkmalen
o Ersetzen von Merkmalsauspr<gungen durch Platzhalter
o Ersetzen von Merkmalen durch Pseudonyme (Bsp. Siemens -> Schönes Leben)
Frage stellen
o Aggregation von Merkmalen (Bsp. Köln -> Deutschland)
o Ersetzen durch Merkmale mit vergleichbarer Bedeutung (Opel Werk-> Produktionsstandort)
Welche statistischen Kennzahlen kennen Sie.Wann ist ihr Einsatz sinnvoll?
Mean Squared Error (MSE) / Mittlere Quadratische Abweichung
➔ Absolute Error (AE) / Absoluter Fehler
➔ Normalized Absolute Error / Normalisierter absoluter Fehler
➔ Relative Error (AE) / Relativer Fehler
➔ Sinnvoll bei:
o Versuchsumfangsbestimmung zur Einhaltung von Genauigkeitsvorgaben
o Konstruktion von Versuchsanlagen zur Ausschaltung von Störgrössflen
o Faktorbestimmung
o Sequentialanalyse
Erlautern Sie den Begriff statistisch signifikant in eigenen Worten.
Statistisch signifikant bedeutet, dass ein beobachteter Unterschied oder ein Muster in Daten wahrscheinlich nicht auf Zufall zurückzuführen ist