Semantik und Semantisches Web Flashcards

1
Q

Was bezeichnet man als gemeinsame Informationsnutzung (information sharing)?

A

Die Bereitstellung eines Zugriffs auf die Menge von heterogenen, autonomen und verteilten In-formationsquellen und die automatische Verarbeitbarkeit der vorgefundenen Informationen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Probleme durch Darstellung des Web-Inhalts im Hinblick auf menschliche Nutzung.

A
  • Viele Suchergebnisse bei geringer Präzision/Relevanz
  • keine oder nur wenige Treffer ergeben
  • Die Suchergebnisse sind stark vom verwendeten Vokabular abhängig
  • Es werden nur einzelne Web-Seiten als Suchergebnis geliefert.
  • Auch bei erfolgreicher Suche müssen die Benutzenden in den gelieferten Dokumenten die interessierende Information manuell, und damit mit erheblichem kognitiven Aufwand, herausfiltern.
  • Suchergebnisse sind für andere Programme kaum nutzbar und müssen manuell integriert werden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Konzept des semantisches Netzes:

A

Computerbasierte Dienste bieten dabei dem Nutzenden bei Suche, Sichtung und Bewertung von Informationen Unterstützung an, indem sie den semantischen Hintergrund der dargestellten Informationen interpretieren und automatisch maschinell weiterverarbeiten.

Darüber hinaus sollen Beziehungen zwischen den interpretierten Informationen vom System erkannt werden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Probleme bei der Etablierung eines semantischen Netzes

A

Als zentrale Probleme erweisen sich im semantischen Netz die syntaktische, strukturelle und semantische Heterogenität der Informationsquellen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Die Probleme, die sich allgemein aus der Heterogenität der Daten ergeben:

A
  • die Syntax – z. B. heterogene Datenformate,
  • die Struktur – z. B. Homonyme, Synonyme oder unterschiedliche Attributnamen in Datenbanktabellen,
  • die Semantik – z. B. die beabsichtigte Bedeutung von Ausdrücken in speziellem Zusammenhang oder Anwendung.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was ist ein semantisches Netz und wozu wird es verwendet?

A

Ein Semantisches Netz (semantic web) hilft dabei, die im Web verfügbaren Inhalte maschinell verarbeiten zu können. Dabei wird der semantische Hintergrund der dargestellten Informationen interpretiert und Beziehungen zwischen den interpretierten Informationen vom System erkannt und automatisch maschinell verarbeitet. Dies soll den Benutzern helfen, die richtigen bzw. relevanten Informationen zu finden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Welches sind die Bestandteile eines RDF-Tripels? Nennen Sie zwei mögliche Darstellungsformen

A

Ressource/Subjekt, Prädikat, Objekt. Als Graf oder als XML-Notation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Die Entwicklung des semantischen Webs auf vier Ebenen:

A
  • die Ebene der technischen Aspekte eines Computernetzwerks,
  • die Ebene des Webs als Benutzungsschnittstelle für die Interaktion zwischen Mensch und Internet,
  • Wissensebene,
  • Anwenderebene eines Wissensnetzwerks im Sinne einer Basis für soziale Netz-werke.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Zudem werden den Benutzenden bestimmte Aufgaben abgenommen (semantisches Web, dritte Ebene):

A
  • Informationssuche,
  • Informationssammlung,
  • Informationsklassifikation,
  • Informationsfilterung,
  • Informationsmanagement,
  • Information-Mining,
  • Informationsentdeckung,
  • Informationsbewertung
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was sind Metadaten?

A

Mit Metadaten kann der Sinn von Daten explizit aus-gedrückt werden, sie beziehen sich also häufig auf die Semantik.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wie definiert sich ein RDF-Tripel?

A

Subjekt bzw. Ressource, Prädikat und Objekt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wozu nutzt man RDF?

A

In einem ersten Schritt kann RDF dazu verwendet werden, einer Ressource Annotationen hinzuzufügen. Auf diese Weise kann die Ressource genauer beschrieben und ihre Beziehung zueinander aufgezeigt werden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

RDF bietet einige für die Repräsentation von Metadaten wichtige Eigenschaften.

A

Dazu gehören die sogenannten Reifikations- und Aggregationsmechanismen.

Ersterer erlaubt es, Aussagen über Aussagen zu treffen, indem ein eindeutiger Bezeichner, auch ID genannt, für jedes Statement eingeführt wird, wodurch es zu einer Ressource wird.

RDF erlaubt außerdem, dass ein Merkmal mehrere Werte annehmen kann. Hierfür stellt RDF Datentypen für Listen und Mengen von Ressourcen zur Verfügung, die ihrerseits wiederum Ressourcen darstellen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Nachteil von RDF:

A

Als Nachteil gilt, dass nur zweistellige Relationen zugelassen sind, sodass mehrstellige umständlich durch mehrere zweistellige Relationen dargestellt werden müssen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Reflikation

A

Reifikation beschreibt die Fähigkeit, eine Aussage als eigene Ressource zu modellieren, was es erlaubt, Aussagen in anderen Aussagen zu referenzieren. Dies ermöglicht die Verkettung von Aussagen und das Treffen von Aussagen über Aussagen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Argumentationsbaum

A

Argumente bestehen aus Prämissen und Schlussfolgerungen, wobei die Prämisse eines Arguments auch ein anderes Argument sein kann. Dies ermöglicht die Verkettung von Argumenten, was zu einer Argumentationsbaumstruktur führt.

17
Q

Woraus besteht ein Argument im Sinne des Argument Interchange Format (AIF)? Was sind die Aufgaben der sogenannten S-Knoten, bzw. I-Knoten?

A

Ein Argument besteht aus einer oder mehreren Prämissen und einer Schlussfolgerung. Die I-Knoten enthalten dabei aussagenbezogene Informationen wie eine Behauptung oder ermittelte Da-ten, die S-Knoten erfassen die Anwendung von Schemata (Argumentation, Inferenz, …).
Ein Spezialfall sind dabei die RA-Knoten, die eine Regel der Inferenzanwendung darstellen.

18
Q

Was definiert RDF-S?

A

Vokabular, welches in RDF-Datenmodellen Verwendung findet, und spezifiziert, welche Merk-male zu welchen Objekten gehören. Weiter wird spezifiziert welche Werte die Objekte annehmen können und die Beziehungen zwischen Objekten werden beschrieben.

19
Q

Was ist RDF-S?

A

RDF-S ist somit bereits eine primitive Ontologie-Sprache. Sie stellt verschiedene Primitive mit festgelegter Bedeutung zur Verfügung. Dazu gehören die Konzepte von class und subclass-Beziehungen, property und subproperty-Beziehungen sowie do-main- und range-Einschränkungen. Mithilfe von speziellen Abfragesprachen können Abfragen über RDF bzw. RDF-S Dokumente formuliert werden.

20
Q

Was sind Primitive in RDF-S?

A

Wie schon erwähnt können mit RDF Aussagen über Aussagen getroffen werden. Hierzu dienen die Primitive.

21
Q

Was ist OWL?

A

Die Abkürzung OWL steht für Web Ontology Language. OWL wurde 2001 durch die Ontology Working Group vom W3C erstellt, um eine Strategie zu entwickeln, mithilfe derer die Informationen im Internet besser zugänglich und vor allem für Maschinen einheitlicher zu handhaben sein sollten.

22
Q

Warum sind Syntax und Semantik wichtig für eine Ontologie?

A

Syntax und Semantik sind notwendig, um eine Ontologie zu schreiben, die nicht mehrdeutig ausgelegt werden kann. Die Semantik ist die Voraussetzung um eine allgemein-gültige Verständigung über das Internet zu ermöglichen.

23
Q

Was enthält eine OWL Ontologie?

A

Eine OWL-Ontologie beinhaltet eine Anzahl von Beschreibungen, Klassen, Eigenschaften, Individuen, Axiomen und Fakten.

24
Q

Wozu werden Axiome genutzt?

A

Axiome werden im Allgemeinen benutzt, um Klassen und Eigenschaften Informationen und Charakteristiken zuzuordnen. Unterschieden werden sogenannte Klassenaxiome und Eigenschaftenaxiome.

Mit Klassenaxiomen werden Klassen definiert.

Es gibt grundsätzlich zwei verschiedene Arten von Eigenschaften. Die einen spezifizieren Eigenschaften mittels Datenwerten wie z. B. Integer. Die andere Art definiert Eigenschaften in Abhängigkeit von anderen Individuen.

25
Q

Data ranges in OWL:

A

Dateneigenschaften werden mithilfe von sogenannten dataRanges eingeschränkt. Diese bestimmen eine Menge von Datenwerten, die sich auf einen bestimmten Daten-Typ beschränken lässt.

26
Q

Was definiert Range in OWL?

A

Eine Range definiert, welche Individuen oder Datenwerte Objekte der spezifizierten Property sein können.

27
Q

Rolle der Metadaten:

A
  • Inhaltsunabhängige Metadaten sind Daten, die nicht direkt zum informationellen Inhalt von Daten in Beziehung stehen. Sie beschreiben vielmehr den Kontext und die Umgebung, in der diese eingebettet sind wie Autor des Dokuments und Erzeugungsdatum.
  • Inhaltsabhängige Metadaten sind Daten über Informationen, die direkt vom In-halt der Daten abgeleitet sind, jedoch nicht den Inhalt beschreiben, wie Größe des Dokuments oder Anzahl der Wörter.
  • Auf dem Inhalt basierende Metadaten geben direkt den Inhalt von Daten wieder, fügen jedoch Information, Wissen oder sonstige Strukturen an, die die Verarbeitung der Originaldaten effizienter gestalten sollen wie z. B. Dokumentvektoren oder Volltextindizes.
  • Inhaltsbeschreibende Metadaten sind Daten, die auf dem Inhalt der ursprüngli-chen Daten beruhen, die aber nicht direkt aus ihnen hervorgehen. Sie geben ei-ne Zusammenfassung des Inhalts und helfen z. B. Entscheidungen zu treffen, ob eine Informationsquelle passend für eine bestimmte Aufgabe ist wie eine Schlüsselwortliste oder ein Glossar.
28
Q

Nutzen von Metadaten:

A
  • Wissensanbietern ermöglichen sie die Organisation, Instandhaltung und Katalogisierung ihrer Daten.
  • Informationsnutzern helfen sie beim Auffinden, Zugang und der Interpretation von Wissen.
29
Q

Metadaten können in den verschiedensten Gebieten zur Anwendung kommen:

A
  • Suche: Durch den Gebrauch von Themenbeschreibungen, Schlüsselwortlisten und Inhaltszusammenfassungen können Metadaten dazu dienen, Information und Wissen im Web zu lokalisieren, ohne den Inhalt der entsprechenden Seite genauer zu untersuchen.
  • Zugriff: Metadaten bezüglich technischer Eigenschaften einer Informationsquelle wie etwa Formatierung und Codierung können den Aufwand zur Verarbeitung erheblich reduzieren.
  • Interpretation: Eine Applikation benötigt nicht nur den Zugriff auf Information und Wissen, sondern muss auch in der Lage sein, diese zu interpretieren. Informationen über die enthaltene Terminologie und erforderliches Wissen, um den Inhalt zu interpretieren, ermöglichen es sowohl Benutzenden als auch intelligenten Systemen den eigentlichen Inhalt der Informationsquelle besser zu verstehen.
30
Q

Standards von Metadaten:

A

Syntaktische Standards, Topic Maps, Strukturelle Standards, Inhaltsbezogene Standards

31
Q

Herausforderungen von Metadaten:

A
  • Vollständigkeit: Um einen vollen Zugriff gewährleisten zu können, muss gesichert werden, dass die Wissensressource mit allen informationell relevanten Metadaten annotiert ist. Andernfalls geht Suchmaschinen, die Metadaten orientiert vorgehen, wichtige Information verloren.
  • Konsistenz: Metadaten sind nur brauchbar, wenn sie den Inhalt der Wissensressource korrekt beschreiben. Tatsächlich sind inkonsistente Metadaten ein viel größeres Problem als fehlende Metadaten. Eine typische Inkonsistenz ist z. B der Fall, bei dem innerhalb der Metadaten ein bestimmtes Schlüsselwort erwähnt wird (z. B. Wasserspiegel), sich aber der Inhalt der Wissensressource um etwas anderes dreht (z. B. Energieschutz).
  • Erreichbarkeit: Damit Metadaten wirklich nutzbar sind, müssen sie nicht nur für den Wissensanbieter erreichbar sein, sondern auch für die Benutzer, die diese als Information anwenden wollen.
32
Q

Was ist der Dublin Core?

A

Das Metadatenschema von Dublin Core ist ein weit verbreitetes Schema zur Beschreibung Web-basierter Ressourcen.

Ziel ist die leichte Auffindbarkeit von Objekten durch Metainformationen.

  • 15 Kernfelder (Core Elements) sind vorgesehen, die als allgemein verständliche Bezeichner von Meta-Tags verwendet werden
  • Bsp.: date, type, format, subject ……
  • Die Felder sind optional, können mehrmals und in belieber Reihenfolge auftauchen
  • Felder (Simple Dublin Core): identifier, format, type, language, title, subject, coverage, description, crea-tor, publisher, contributor, rights, source, relation, date
33
Q

Folgende Eigenschaften charakterisieren den Dublin Core:

A
  • Einfachheit: Dieses Schema ist sowohl für Anfänger als auch für Experten leicht zu benutzen, da die Syntax in fast allen Elementen allgemein verständlich und überschaubar ist.
  • Semantische Interoperabilität: Um eine qualifizierte Suche im Internet zu ermöglichen, sollten sich Metadaten zwischen verschiedenen Fachgebieten semantisch entsprechen.
  • Erweiterbarkeit: Dublin Core kann mithilfe von verschiedenen detaillierten Beschreibungsmodellen erweitert werden.
  • Modularität im Web: Dublin Core unterstützt eine Architektur von Metadaten wie das bereits genannte RDF, das im Rahmen des W3Cs (World Wide Web Consortium) entwickelt wurde.