Grundlagen der Business intelligence Flashcards

Question

Wie ist die Vorgehensweise bei Klassifikationsanalysen?

Answer 1

Trainingsdatensätze mit Klassifikationslabel als Input, Modellentwicklung generiert Output. Das entwickelte Modell wird dann genutzt um Nichtklassifizierte Daten mit dem Output zu klassifizieren.

Answer 2

Klassifikationsverfahren (Ermittlung von Klassenzugehörigkeit): - Maschinelles Lernen: Verwendung von ML Algorithmus zur Bestimmung der Wahrscheinlichkeit für ein Klassenlabel - Regelbasiert: Assoziationsregeln zur Bestimmung der Wahrscheinlichkeit für ein Klassenlabel - Probabilistisch: Verwendung statistischer Methode zur Bestimmung der Wahrscheinlichkeit für ein Klassenlabel Regression (Ermittlung einer Funktion): Ermittlung einer Beziehung zwischen einer/mehrerer unabhängiger Variablen

Answer 3

Prämisse (Wenn) Implikation (dann)

Answer 4

Deckung = Support Genauigkeit = Konfidenz

Answer 5

Möglichkeit 1: Regel mit längster Prämisse nehmen Möglichkeit 2: Regel mit den besten Werten für Deckung und/oder Genauigkeit nehmen

Answer 6

Decision trees dienen der grafischen Darstellung von Entscheidungsregeln, die sich an der Evidenz der Traningsdaten orientieren.

Answer 7

Jeder Pfad im Baum.

Answer 8

Support Vector Machines Künstliche neuronale Netze Nächste-Nachbarn-Klassifikation

Answer 9

Abbildung der Trainingsdatensätze auf Punkte in einem mehrdimensionalen Raum Klassifikation durch Ermittlung einer optimalen Trennebene zwischen den Punkten

Answer 10

Vernetzung zahlreicher Neuronen mit jeweils parametrisierter Aktivierungsfunktion Klassifikation durch Gesamtergebnis der Berechnung der Funktionen aller Neuronen

Answer 11

Ermittlung der bereits klassifizierten Objekte mit der kleinsten (Minkowski) Distanz zum fraglichen Objekt Klassifikation anhand Betrachtung der benachbarten Objekte

Answer 12

In einem regelbasierten Vorhersagemodell. Unterschiede bestehen darin, welche Regeln im Modell enthalten sind und ob sie als Regel erkennbar sind oder nicht (Black Box)

Answer 13

Abhängigkeit von Trainingsdaten (Schlechte Qualität -> Schlechte Ergebnisse, da auch Metriken auf Trainingsdaten basieren) Bias Probleme bei verzerrten Trainingsdaten Black Box Problem: Geringe soziale Akzeptanz wenn nicht sichtbar wird, wie klassifiziert wird.

Answer 14

Dass die Betroffenen nicht nachvollziehen können, auf welcher Grundlage bzw auf welche Weise das System, welches auf Basis des Klassifikationsmodells arbeitet, zu einer bestimmten Entscheidung gelangt ist. Studien zeigen, dass Transparenz und Erklärbarkeit bei Entscheidungsunterstützungssystemen bei vielen Geschäftsprozessen sehr entscheidend sind, weil Menschen die Gründe für Entscheidungen verstehen möchten, um die Konsequenzen der Entscheidung abschätzen und die Verantwortung für die Entscheidung übernehmen zu können. Daher befasst sich das Forschungsgebiet der explainable artificial intelligence mit der Fragestellung, wie die Erklärbarkeit und Transparenz von KI basierten Entscheidungen erhöht und somit deren Akzeptanz gesteigert werden kann

Answer 15

Neben dem Black Box Problem ist der oben bereits angesprochene Algorithmic Bias ein wesentliches Problem datengetriebener Analyseverfahren. Führt die Anwendung von Klassifikationsverfahren zu systematischer Diskriminierung gegen Einzelpersonen oder gar ganze Bevölkerungsgruppen (z B Frauen, Menschen bestimmter Hautfarbe, bestimmte Altersgruppen etc so liegt ein ethisches und häufig auch rechtliches Problem vor, welches weder betrieblich noch gesellschaftlich wünschenswert ist. Die aktuelle Studienlage zeigt, dass es bislang nicht überzeugend gelingt, solche Effekte für komplexe Datensätze zu kompensieren. Aufgrund der steigenden Häufigkeit datengetriebener Entscheidungen in vielen Bereichen wird das entsprechende Forschungsgebiet des discrimination aware data mining daher von zunehmender Bedeutung geprägt sein

Grundlagen der Business intelligence Flashcards

(39 cards)