Lektion 5 Flashcards
(39 cards)
5.1 Noch unbehandelte Daten nennt man auch …
Rohdaten
5.1 Welche vier Schritte gehören zur Umwandlung der Rohdaten in einen strukturierten Datensatz?
Sortierung, Zuordnung, Digitalisierung, Formatierung
5.1 Warum sollte man eine Datenaufbereitung machen?
Fehler in der Datenaufbereitung und Datenbereinigung können dazu führen, dass alle Ergebnisse verfälscht sind
5.1 Erkläre belastbare Handlungsempfehlungen.
➢ Nur „saubere“, gut aufbereitete und dokumentierte Datensätze ermöglichen es, Zusammenhänge in Daten zu finden und somit wertvolle Erkenntnisse zu gewinnen
➢ Nur diese können zu belastbaren Handlungsempfehlungen führen können
➢ Zum Großteil werden Unternehmensentscheidungen auf Basis von (Markt-) Forschungsergebnissen getroffen
➢ Man muss sich daher auf die Ergebnisse verlassen können
5.1 Bedeutung des DSGVO und was es beinhaltet.
➢ Datenschutzgrundverordnung Seit 2018
➢ Verordnung der Europäischen Union, mit der die Regeln zur Verarbeitung personenbezogener Daten durch private Unternehmen und öffentliche Stellen EU-weit
vereinheitlicht worden sind.
5.1 Anhand Miterbeiterbefragungen erklären warum bei anonymen Befragungen Rückschlüsse zu ziehen sind. Warum bei einer anonymen Mitarbeiter Befragung die Kombination von Merkmalen kritisch ist anhand eines Beispiels erläutern (wegen der Identifizierbarkeit)
Identifizierbarkeit können bei quantitativen Daten v.a. seltene Merkmale oder Merkmalskombinationen sein, wenn die Zielgruppe bekannt oder besonders klein ist. Dies kann z. B. häufiger bei Mitarbeiterbefragungen der Fall sein. Auch wenn diese anonym sind, könnten durch die Kombination von bestimmten Merkmalen Rückschlüsse auf einzelne Personen sein (Beispiel: Frauen mit einer körperlichen Einschränkung in einer Führungsposition und mit einer Betriebszugehörigkeit von mehr als zehn Jahren). Jedes Merkmal für sich ist relevant für eine Analyse. Aber in dieser Kombination wäre wahrscheinlich leicht ermittelbar (oder zumindest eingrenzbar), um wen es sich handelt.
5.1 Datenbereinigung
Fehlerhafte Werte herausfinden, Entfernung von Dubletten & Umgang mit fehlenden Werten
5.2 Nenne 3 Statistikprogramme
• SPSS
• PSPP
• R
5.2 Was muss man alles tun und welche Formen werden verwendet, um etwas in ein statistisches Programm zu pflegen
- Codeplan erstellen, um Daten auswerten zu können
- den einzelnen Fragen werden Variablennamen zugeordnet
- den einzelnen Merkmalsausprägungen einer Variablen werden Codes zugeordnet
- Eingabe in tabellarischer Form
• Jede Zeile steht für einen Befragten
• Jede Spalte für eine Variable
• Jede Zelle enthält die Antwort auf eine bestimmte Frage
5.2 Warum benötigt jeder Fragebogen eine eigene ID?
• Ermöglicht das eindeutige zuordnen der Antworten zu den Personen
5.2 Worin bestehen die beiden Aufgaben des Codeplans?
Ein Codeplan ordnet den einzelnen Fragen eines Fragebogens Variablennamen und den Merkmalsausprägungen einer Variablen Codes zu
5.2 Erkläre die Aussage, jede Zelle hat seinen variablen wert
Die einzelnen Zellen enthalten die Werte der jeweiligen Variablen des jeweiligen Falles
5.2 Wie muss eine Fragebogen-ID aufgebaut sein?
eindeutig
5.2 Erklären sie was ist eine Matrixfrage und was ist beim Erstellen eines Codeplans hierbei zu beachten?
➢ Bei einer Matrixfrage wird jede Antwort separat codiert
➢ Jede Zeile der Matrix wird als eigene Variable aufgeführt und die Antworten jeweils mit einem Code versehen
Bsp.:
Sie sind = F1 (Geschlechtervariable) Weiblich =1
Männlich= 2
5.2 Drei Funktionen der Datenaufbereitung erläutern (10 P)
Fehler vermeiden
• Unvollständige oder fehlerhafte Datensätze führen zu falschen Ergebnissen und verzerren Analyse
Nutzung für Re- und Sekundäranalyse
• Gut aufbereitete Daten ermöglichen eine spätere Weiterverwendung durch Forscher
Ethische Probleme vermeiden
• Anonymisierung schützt Teilnehmer vor Identifizierbarkeit -> wichtig für Forschungsethik & Datenschutz
5.2 Warum ist sorgfältige Datenaufbereitung wichtig?
Weil es sonst zu Verfälschungen im Ergebnis kommen kann, wenn Fehler in der Datenaufbereitung und
Datenbereinigung passieren. Nur auf Basis von „sauberer“ Daten, also gewissenhaft Aufbereiteten Daten können belastbare Handlungsempfehlungen getroffen werden.
5.2 Schritte/Teile/ Kriterien der Datenaufbereitung erläutern
- Erstellung der Datensätze
• Umwandlung des Rohmaterials in strukturierte Datensätze
• Sortierung, Zuordnung, Digitalisierung, Formatierung - Kommentierung der Datensätze
• Ergänzung der Daten um Metainformationen (Erhebungsdatum, Bedeutung d. Variablen) - Anonymisierung der Datensätze nach DSGVO (Datenschutz)
• Alle Informationen, die zur Identifizierung von Teilnehmern führen können, entfernen - Datenbereinigung
• Fehlerhafte Werte herausfinden, Entfernung von Dubletten & Umgang mit fehlenden Werten - Datentransformation
• Daten zusammenfassen oder recodieren –> ermöglicht repräsentative Ergebnisse
5,3 Was ist ein einfacher Weg, um schnell einen Datenüberblick zu bekommen?
Häufigkeitstabellen
5.3 Wofür dienen Ergebnistabellen?
Anhand von Ergebnistabellen kann man sehen, ob es Variablen gibt, bei denen Codes vorhanden sind, die nicht vorab definiert wurden
5.3 Wie entstehen Fehler bei Ergebnistabellen?
➢ Wenn Befragungen an unterschiedlichen Zeitpunkten wiederholt werden (Wellen)
➢ Wenn nicht alle Datensätze gleich codiert sind
5.3 Kriterien der Datenaufbereitung
➢ Vollständigkeit aller relevanten Daten
➢ Einheitlichkeit: Gleiche Formate (z.B. Datums- oder Währungsangaben)
➢ Ausschluss doppelter Werte (entfernen von Dubletten)
➢ Behandlung fehlender Werte: Strategien, um mit fehlenden Werten umzugehen
➢ Ausreißererkennung: Identifikation ungewöhnlicher Werte
➢ Plausibilität d. Antwortmuster: sicherstellen, dass Antworten logisch konsistent sind
5.3 Schritte der Datenbereinigung
- Überprüfung d. Häufigkeitsverteilung, um nicht definierte Werte oder Codierungsfehler zu entdecken
- Anonymisierung d. Datensätze nach DSGVO: Sicherstellung, dass keine Identifizierung der Befragten möglich ist -> besondere Vorsicht bei seltenen Merkmalskombinationen (dürfen keine Rückschlüsse auf Einzelpersonen zulassen)
- Fehlererkennung: Korrektur o. Entfernung von unplausiblen o. fehlerhaften Daten
- Stereotype Antwortmuster: Identifikation von Befragten, die konsistent extreme o. mittlere Werte ankreuzen
- Löschung d. IP-Adresse: zum Schutz d. Anonymität d. Befragten
5.3 Was bezeichnet der Schritt der Anonymisierung?
Nach der Datenschutzgrundverordnung (europäische Union seit 2018), gibt es verbindliche Regeln zur Verarbeitung von personenbezogenen Daten durch private Unternehmen und öffentlichen Stellen. Die Datensammlungen dürfen keine Rückschlüsse auf Personen zulassen. Es müssen alle Informationen, die zur Identifizierung von Teilnehmern führen könnten, entfernt werden
5.3 Definition IP-Adresse:
➢ Adresse im Computernetzwerk
➢ basiert auf Internetprotokoll
➢ wird Geräten zugewiesen und macht sie somit adressierbar und erreichbar