Kapitel 1 - Einführung und Motivation Flashcards

1
Q

Welches Problem hat das WWW (derzeit) als Datenquelle?

A

Semi- oder unstrukturierte Daten

  • Derzeit sind viele Daten im WWW semi- oder unstrukturiert
  • in dieser Form können sie nicht einfach weiter verwendet werden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was macht stukturierte Daten aus? Aus welchen Datentypen bestehen sie?

A
  • Stukturierte Daten sind in einer festen konsistenten Struktur angeordnet (Relationale DB)
  • sie bestehen aus elementaren Datentypen wie z.B. Zahlen oder Strings
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was macht semi-strukturierte Daten aus? Aus welchen Datentypen bestehen Sie?

A
  • Semi-stukturierte Daten haben eine möglicherweise wechselnde Struktur
  • sie können durch Markup-Languages (XML) beschrieben werden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was macht unstrukturierte Daten aus? Aus welchen Datentypen bestehen sie?

A
  • es ist keine Struktur vorhanden, die ein Schema über die Daten bauen lässt
  • sie bestehen aus Binären oder Fließtext-Objekten (Binary Large Object (BLOB), Carachter LOB (CLOB))
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Warum ist Text- uind Webmining wichtig?

A

Um riesige Menge an Daten verarbeiten und nutzen zu können

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Definiere Text-Mining

A

Texte bieten große Mengen an unstrukturierten Informationen. Text-Mining verwendet statistische Methoden um Wissen aus diesen Daten zu ziehen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Definiere Web-Mining
Woraus besteht es?

A

Web-Mining bezeichnet die Verwendung von Data-Mining Ansätzen speziell auf Web-Dokumenten bzw. Diensten.
Dabei werden Elemente aus:
- Machine-Learning
- Datenbanken
- Social Network Analyse
- und Natural Language Processing
verwendet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist Web-Usage-Mining? Woher kommen dabei die Daten?

A

Web-Usage-Mining beschreibt die Muster-Erkennung auf den Interaktionsdaten eines Users mit einer oder mehreren Webseiten.

Als Datenquelle können z.B. Server-Logs oder Nutzerprofile dienen. Eine weit verbreitete Analyse-Methode arbeitet mit Google-Analytics und wird in viele Webseiten gebaut um die Nutzer zu tracken.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was ist Web-Structure-Mining?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was ist Web-Content-Mining? Wofür wird es verwendet?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Aus welchen Schritten besteht der KDD Prozess?

Außerdem, was heißt eigentlich KDD?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly