Grundlagen der Business intelligence Flashcards

1
Q

Was ist Business Intelligence?

A

Ein integrierter, unternehmensspezifischer, IT basierter Ansatz zur betrieblichen Entscheidungsunterstützung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was sind Aufgaben der BI?

A

Data Delivery

Data Mining

Knowledge Sharing

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was gehört zu Data Delivery?

A
  • Extraktion von Daten aus operativen Systemen
  • Integration der Daten in eine einheitliche Informationsbasis
  • Verwaltung der Informationsbasis in einem Data Warehouse
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was gehört zu Data Mining?

A
  • Erkennung von Zusammenhängen/mustern in den Daten
  • Erstellung von Vorhersagemodellen auf Basis der Muster
  • Überprüfung und Anwendung der erstellten Vorhersagemodelle
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was gehört zu Knowledge Sharing?

A
  • Visuelle Aufbereitung der gewonnenen Erkenntnisse
  • Kommunikation der Erkenntnisse and die Entscheidungsträger
  • Umsetzung der Erkenntnisse im strategischen Management
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was sind Eigenschaften interessanter Muster?

A

gültig; mit hinreichender statistischer Sicherheit ist Muster auch in Realwelt sichtbar

bislang unbekannt: nicht offensichtlich und bisher noch nicht bekannt gewesen

potenziell nützlich: Die aus dem Muster abzuleitende Erkenntnis hat betriebswirtschaftliche Relevanz

einfach verständlich: Muster ist klar erkennbar und lässt sich auf unkomplizierte Weise reproduzieren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was ist das People Analytics Reifegradmodell und welche Level hat es?

A

Den Anteil an Umsetzung verschiedener Stufen der BI in unternehmerischen HR Prozessen zeigt.

Level 4 - Vorhersagende Analytik

Level 3 - Fortgeschrittene Analytik

Level 2 - Erweiterte Berichterstattung

Level 1 - Operative Berichterstattung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was gehört zu Level 1?

A

Reaktives,, operatives Reporting von Effizienz- und Compliance Maßnahmen mit Schwerpunkt auf Datengenauigkeit, Konsistenz und Zeitrahmen.

(56% der Organisationen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was gehört zu Level 2?

A

Proaktive, operative Berichterstattung für Benchmarking und Entscheidungsfindung, mehrdimensionale Analysen und Dashboards.

30% der Organisationen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was gehört zu Level 3?

A

Statistische Modellierung und Ursachenanalyse zur Lösung von Geschäftsproblemen, proaktives Identifizieren von Problemen und Empfehlen von Lösungen

10% der Organisationen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was gehört zu Level 4?

A

Entwicklung von Vorhersagemodellen, Szenarienplanung, Risikoanalyse und -minderung, Integration in die strategische Planung

4% der Organisationen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was sind Methoden des Data Mining?

A

Assoziationsanalysen:

  • Aufdeckung von strukturellen Zusammenhängen und Korrelationen in Daten
  • Erstellen von Wenn-Dann Regeln auf Basis der Muster

Klassifikationsanalysen:

  • Erstellung von Modellen zur Vorhersage der Klassenzugehörigkeit von Objekten
  • Anwendung der Modelle auf neue, nichtklassifizierte Objekte

Clusteranalysen:

  • Bildung von Klassen von zueinander ähnlichen Objekten
  • Aufspüren von Ausreißern die zu keiner Gruppe gehören
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was ist die systematische Generierung von Wissen aus empirischen Daten?

A

WIrd als machine Learning bezeichnet, ist eine Teildisziplin der künstlichen Intelligenz

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was ist KI?

A

Die Befähigung von Maschinen, Aufgaben zu erfüllen die menschliche Intelligenz erfordern

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was ist Deep Learning?

A

Ein Teilgebiet des maschinellen Lernens welches den Lernprozess mit sehr großen Datensätzen und über mehrere Lernebenen ausführt um komplexe Aufgaben wie Sprach- oder Bilderkennung automatisiert durchführen zu können.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wozu kann Machine Learning im Data Mining Kontext eingesetzt werden?

A

Um den Vorgang der datengetriebenen Mustererkennung zu atomatisieren.

17
Q

Welche Arten von Lernen gibt es (ML)?

A

Überwachtes Lernen (Klassifikationsanalyse)

  • Lernen einer neuer Funktion (Modell) aus gegebenen Paaren von Ein-und Ausgaben
  • Ziel: automatische Klassifikation neuer Objekte mit der gelernten Funktion

Unüberwachtes Lernen (Clusteranalyse)

  • Erkennung von zusammengehörigen Gruppen und Ausreißern in den Datensätzen.
  • Ziel: automatische Erkennung von Klassen für die Klassifikation neuer Objekte
18
Q

Was sind Assoziationsanalysen?

A

Eine erweiterte Form der Korrelationsanalyse, bei der
untersucht wird, welche Kombinationen von Variablenwerten häufig im Zusammenhang mit bestimmten Beobachtungen stehen.

Ein typischer Anwendungsfall hierfür sind Warenkorbanalysen die sich damit befassen, welche Produkte häufig gemeinsam gekauft werden

19
Q

Was beschreibt eine Assoziationsregel A->B?

A

Eine Korrelation zwischen gemeinsam auftretenden Elementen innerhalb von n Transaktionen.

A und B sind Mengen von mindestens einem Produkt.
A->B bedeutet, dass der Kauf von A den Kauf von B impliziert.

20
Q

Was sind Kenngrößen von Assoziationsregeln?

A

Support: Relative Häufigkeit der Fälle, in denen die Regel anwendbar ist.

Konfidenz: Relative Häufigkeit der Fälle, in denen die Regel richtig ist.

Lift: Faktor, um den das Vorhandensein von A das Auftreten von B wahrscheinlicher macht.

Aber: immer nur vergangene Käufe und Korrelation != Kausalität

21
Q

Was bedeutet ein hoher Support?

A

Es gibt viele Datensätze die Aussagen über A und B treffen

22
Q

Was bedeutet eine hohe Konfidenz?

A

Es gibt viele Personen die zusammen mit A auch B gekauft haben (bedingte Wahrscheinlichkeit)

23
Q

Was bedeutet ein hoher Lift?

A

Der Kauf von A ist ein guter Indikator für den Kauf von B

24
Q

Was ist das wesentliche Ziel von Klassifikationsanalysen?

A

Die Entwicklung von Vorhersagemodellen.

25
Q

Wie ist die Vorgehensweise bei Klassifikationsanalysen?

A

Trainingsdatensätze mit Klassifikationslabel als Input, Modellentwicklung generiert Output. Das entwickelte Modell wird dann genutzt um Nichtklassifizierte Daten mit dem Output zu klassifizieren.

26
Q

Was sind Möglichkeiten zur Erstellung von Vorhersagemodellen?

A

Klassifikationsverfahren (Ermittlung von Klassenzugehörigkeit):

  • Maschinelles Lernen: Verwendung von ML Algorithmus zur Bestimmung der Wahrscheinlichkeit für ein Klassenlabel
  • Regelbasiert: Assoziationsregeln zur Bestimmung der Wahrscheinlichkeit für ein Klassenlabel
  • Probabilistisch: Verwendung statistischer Methode zur Bestimmung der Wahrscheinlichkeit für ein Klassenlabel

Regression (Ermittlung einer Funktion):
Ermittlung einer Beziehung zwischen einer/mehrerer unabhängiger Variablen

27
Q

Welche Teile enthält eine Assoziationsregel (Wenn-Dann)?

A

Prämisse (Wenn)

Implikation (dann)

28
Q

Was entspricht Deckung und Genauigkeit bei Assoziationsregeln?

A

Deckung = Support

Genauigkeit = Konfidenz

29
Q

Was passiert wenn mehr als eine Assoziationsregel anwendbar ist?

A

Möglichkeit 1: Regel mit längster Prämisse nehmen

Möglichkeit 2: Regel mit den besten Werten für Deckung und/oder Genauigkeit nehmen

30
Q

Was sind Entscheidungsbäume?

A

Decision trees dienen der grafischen Darstellung von Entscheidungsregeln, die sich an der Evidenz der Traningsdaten orientieren.

31
Q

Was entspricht in einem Decision tree genau einer Assoziationsregel?

A

Jeder Pfad im Baum.

32
Q

Was gibt es, abgehen von Dec. trees noch für ML-basierte Klassifikationsverfahren?

A

Support Vector Machines

Künstliche neuronale Netze

Nächste-Nachbarn-Klassifikation

33
Q

Was sind Support Vector Machines?

A

Abbildung der Trainingsdatensätze auf Punkte in einem mehrdimensionalen Raum

Klassifikation durch Ermittlung einer optimalen Trennebene zwischen den Punkten

34
Q

Was sind künstliche neuronale Netze?

A

Vernetzung zahlreicher Neuronen mit jeweils parametrisierter Aktivierungsfunktion

Klassifikation durch Gesamtergebnis der Berechnung der Funktionen aller Neuronen

35
Q

Was ist Nächste Nachbarn Klassifikation?

A

Ermittlung der bereits klassifizierten Objekte mit der kleinsten (Minkowski) Distanz zum fraglichen Objekt

Klassifikation anhand Betrachtung der benachbarten Objekte

36
Q

Worin resultieren alle ML-basierte Klassifikationsverfahren?

A

In einem regelbasierten Vorhersagemodell.

Unterschiede bestehen darin, welche Regeln im Modell enthalten sind und ob sie als Regel erkennbar sind oder nicht (Black Box)

37
Q

Was sind Probleme des Data Mining?

A

Abhängigkeit von Trainingsdaten (Schlechte Qualität -> Schlechte Ergebnisse, da auch Metriken auf Trainingsdaten basieren)

Bias Probleme bei verzerrten Trainingsdaten

Black Box Problem: Geringe soziale Akzeptanz wenn nicht sichtbar wird, wie klassifiziert wird.

38
Q

Was ist das Black Box Phänomen?

A

Dass die Betroffenen nicht nachvollziehen können, auf welcher Grundlage bzw auf welche Weise das System, welches auf Basis des Klassifikationsmodells arbeitet, zu einer bestimmten Entscheidung gelangt ist.

Studien zeigen, dass Transparenz und Erklärbarkeit bei Entscheidungsunterstützungssystemen bei vielen Geschäftsprozessen sehr entscheidend sind, weil Menschen die Gründe für Entscheidungen verstehen möchten, um die Konsequenzen der Entscheidung abschätzen und die Verantwortung für die Entscheidung übernehmen zu können.

Daher befasst sich das Forschungsgebiet
der explainable artificial intelligence mit der Fragestellung, wie die Erklärbarkeit und Transparenz von KI basierten Entscheidungen erhöht und somit deren Akzeptanz gesteigert werden kann

39
Q

Was ist Discrimination Aware Data Mining?

A

Neben dem Black Box Problem ist der oben bereits angesprochene Algorithmic Bias ein wesentliches
Problem datengetriebener Analyseverfahren.

Führt die Anwendung von Klassifikationsverfahren zu
systematischer Diskriminierung gegen Einzelpersonen oder gar ganze Bevölkerungsgruppen (z B
Frauen, Menschen bestimmter Hautfarbe, bestimmte Altersgruppen etc so liegt ein ethisches und
häufig auch rechtliches Problem vor, welches weder betrieblich noch gesellschaftlich wünschenswert ist.

Die aktuelle Studienlage zeigt, dass es bislang nicht
überzeugend gelingt, solche Effekte für komplexe Datensätze zu kompensieren. Aufgrund der steigenden Häufigkeit datengetriebener Entscheidungen in vielen
Bereichen wird das entsprechende Forschungsgebiet des discrimination aware data mining daher von
zunehmender Bedeutung geprägt sein