BI All Flashcards

1
Q

Wie grenzt man ein Data Warehouse von einem Business intelligence System ab?

A

Data Warehouse sorgt für das sammeln der Daten, BI führt gesammelte Daten zusammen und wertet sie aus.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Aus welchen Komponenten besteht ein DW?

A

Arbeitsbereich, Basisdatenbank (Core), Ableitungsdatenbank, Auswertungsdatenbank, Metadaten, Datawarehouse Manager

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Welche Aufgaben?

A

Extract, Transform, Load (ETL)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Mit welchen Datenqualitätsproblemen sieht man sich konfrontiert und wie lassen sich diese beheben?

A

Konsistenz, Zuverlässigkeit, Granularität, Dokumentation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

additive Kennzahlen

A

-Optimalfall
-(additive) Berechnung zwischen allen
Konsolidierungsebenen der Dimensionen möglich
-D.h. Standard-Aggregationsmethode „Summation“
ist über alle Dimensionen hinweg sinnvoll
-Flussgrößen wie Umsätze oder Kosten sind
im Normalfall vollständig additiv
-Können z.B. über den Zeitverlauf und über
verschiedene Regionen hinweg addiert werden
-z.B. Einkaufswert, Bestellmenge eines Artikel pro Tag

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Semi-additive Kennzahlen

A

-(additive) Berechnung nur für ausgewählte Menge
von Hierarchieebenen
-D.h. Bestandsgrößen sind meistens über alle
Dimensionen außer der Zeit additiv aggregierbar
-z.B. Lagerbestand, Kontostand, Einwohnerzahl pro Stadt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Nicht-additive Kennzahlen

A
additive Berechnung nach keiner denkbaren
Dimension sinnvoll möglich
-Im Allgemeinen Durchschnitts- oder
prozentuale Werte
-Beispiele
 gemessene Temperatur im Zeitverlauf
oder über Orte hinweg aufzusummieren
 Noten können ebenfalls nicht sinnvoll addiert werden
 Wechselkurs
 Steuersatz
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hub and Spoke

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Standard SQL Abfrage

A

SELECT: Welche Attribute
FROM: Welche Tabellen
WHERE: Bedingungen
GROUB BY: Gruppierung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

QUBE Syntax

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

RollUp Syntax

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Slicing

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Dicing

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Drill up and drill down

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Pivoting

19
Q

Nicht volatilität

A

Nicht-Volatilität: Daten im DWH werden dauerhaft abgelegt und für die Analyse zur Verfügung gestellt. DWH-Daten werden somit in der Regel nicht mehr geändert, überschrieben oder entfernt.

20
Q

ME/R Diagram

21
Q

Star Schema

22
Q

Geben Sie an, was man unter einer Referenzarchitektur versteht und
erläutern Sie deren Ziele.

A

Ein Referenzmodell stellt ein Modellmuster dar,
das als idealtypisches Modell für die Klasse der
zu modellierenden Sachverhalte angesehen wird.

  • Unterstützung des Vergleichs
  • Planungserleichterung für konkrete DWH-Implementierung
  • Erhöhung der Übersicht und Komplexitätsverringerung
  • Visualisierung und Homogenisierung von Begriffen
23
Q

Aus welchen Stufen besteht die vierstufige DW-Grundarchitektur? Erläutern
Sie deren einzelnen Komponenten und die zugehörigen Transformationsschritte.

A

• Quellsystem -> Staging Area
o Zugriff über View Layer für Unabhängigkeit von Strukturänderungen
• Staging Area
o Daten werden gespeichert, wie sie ausgeliefert werden
• Staging Area -> Cleansing Area:
o Filtern von fehlerhaften Daten
 Korrigieren oder Defaultwerte
o Form vereinheitlichen
• Cleansing Area
• Cleaning Area -> Core
o Versionierung der Stammdaten
o Laufend neue Daten
o Gleiche Detaillierungsstufe wie geliefert
o Keine Aggregation
• Core
o Speichern über langen Zeitraum
o Themenspezifisch strukturiert
o Historische Daten
o Keine direkten Zugriffe
• Core -> Mart
o Fachliche Aufbereitung der Daten in gewünschte Hierarchiestufen
o Aggregation der Bewegungsdaten
• Data Mart
o Teilmengen der Daten
o Für die jeweilige Anwendung relevant
• ETL-Prozesse: Die Datenflüsse. Extrahieren, Transformieren, Laden
• Metadaten: Fachlich und technisch. „Daten über Daten“

24
Q

Geben Sie verschiedene Monitoring-Strategien an und erläutern Sie diese.

A
	Trigger-
	Replikations-
	Log-
	Zeitstempel-
	Snapshot-basiert
25
Was versteht man unter einem Data Mart? Grenzen Sie es zum DWH ab. Welche Formen von Data Marts existieren?
Data Warehouse: Sammeln der Daten Data Mart: Auswertung ``` o Abhängige Data Mart  Hub and Spoke  Informationen aus der Ableitungsdatenbank o Unabhängige Data Mart  Unabhängige kleine DWH ```
26
Erläutern Sie den ETL-Prozess beim Data Warehousing.
• Extraktion o Übertragen von Daten aus Datenquellen in den Arbeitsbereich • Transformation o Integration: Vorbereiten und Anpassen der Daten für das Laden o Harmonisierung: Überführung aller Daten in ein einheitliches internes Format o Datenbereinigung: Beseitigung von fehlerhaften Werten • Laden o Übertragung der Transformierten Daten in die Basis, Ableitungs- und Auswertungsdatenbanken
27
Welche Schritte können eine Transformation erfordern?
o Integration: Vorbereiten und Anpassen der Daten für das Laden o Harmonisierung: Überführung aller Daten in ein einheitliches internes Format o Datenbereinigung: Beseitigung von fehlerhaften Werten
28
Welche Arten von Berichten/Analysen soll ein DW unterstützen?
-Planungsberichte (als Grundlage und Ergebnis der strategischen und operativen Planung)  Abweichungsberichte (z.B. Monats- und Quartalsberichte)  Statusberichte (z.B. Geschäftsberichte)
29
Nennen Sie 3 mögliche Data-Mining Methoden und BeispielAnwendungen?
- Klassifikation: Zuordnen von Daten zu vorgegebenen Klassen - Segmentierung: Clusterbildung, d.h. Daten werden bzgl. ihrer Merkmalsausprägung zu Gruppen zusammengefasst - Assoziationsanalyse: Entdecken von Regeln, die gemeinsam auftretende Elemente des Datenbestands beschreiben
30
Was ist ein InfoObject
31
Was ist ein aDSO
``` Das advancedDSO (aDSO) ist der neue Allrounder des SAP BW und gilt als zentraler (gar einziger) InfoProvider der Modellierung in der SAP Version BW/4HANA. Das aDSO kann nur über die BW-Modellierungswerkzeuge im SAP HANA Studio bzw. in Eclipse angelegt und bearbeitet werden. ```
32
Erläutern Sie anhand je eines Anwendungsbeispiels die OLAP-Operationenp
- Drill-Across - Pivotierung - Drill-Down, Roll-Up - Data Slicing - Data Dicing
33
. Welche Ziele verfolgen die 12 OLAP-Regeln nach Codd?
 Rot: Intuitiver, schneller, direkter Zugriff auf alle Daten  Grün: Flexibles Reporting  Blau: Performante und skalierbare Infrastruktur
34
Erläutern Sie, was man unter FASMI im Kontext von OLAP versteht.
Fast Analysis of Shared Multidimensional Information
35
Vergleichen Sie OLTP- und OLAP-Systeme in Hinblick auf die Daten-, Anfrage- und Anwendersicht.
36
Welche Ziele werden mit den Data-Mining-Verfahren verfolgt?
37
Erläutern Sie die Zielsetzung einer Clusteranalyse.
38
Was ist das Ziel einer ABC-Klassifikation?
39
Assoziationsanalyse
40
Erläutern Sie den Aufbau von Entscheidungsbäumen im Rahmen der Klassifikation. Geben Sie ein Beispiel für einen Entscheidungsbaum an.
41
Geben Sie für jede der vorgestellten Verfahrensklasse ein Anwendungsszenario an.
Klassifikation: Kreditwürdigkeit
42
Wie berechnet man Support, Konfidenz und Lift bei der Assoziationsanalyse? Was bedeuten diese Werte und ist ein größerer/kleinerer Wert besser?
43
Was ist KDD und welche Schritte sind hier nötig?
Knowledge Discovery (in Databases) Auswahl-Aufbereitung-Transformation-Data Mining-Interpretation