U4 Flashcards
(36 cards)
Co to sieci semantyczne
Sieci semantyczne są grafowym schematem reprezentacji wiedzy.
Zawiera ona węzły odpowiadające pojęciom danej dziedziny problemowej i łuki odpowiadające związkom (relacjom) zachodzącym pomiędzy tymi pojęciami.
Jakie wyrózniamy rodzaje relacji w sieciach semantycznych
- ISA (ang. is a) - relacja pomiędzy indywiduum a jego klasą.
- HASA (ang. has a) - relacja część - całość, alternatywnie PART
- AKO (ang. a kind of) - relacja pomiędzy podklasą a nadklasą, alternatywnie SUBCLASS albo SS (subset)
Sieci semantyczne - cechy
- Podlegają reifikacji - przekształcenia relacji w obiekty
- Odpowiadają na pytania przez wnioskowanie
- Dziedziczenie - Koń jest zwierzęciem. Rafał jest koniem. Zatem Rafał jest zwierzęciem.
- Wnioskowanie niemonotoniczne - Wiedza domyślna pojawia się sieciach semantycznych naturalnie dzięki dziedziczeniu
Czym są systemy ramek o jak działają
System ramek składa się z kolekcji ramek, które opisują elementy modelowanej dziedziny.
Ramka działa na podstawie podobnej jak klasy w programowaniu. Posiadają dwa rodzaje atrybutów: własne lub szablonowe. Ramki mogą dziedziczyć od siebie atrybuty.
Atrybuty mają wartości, które mogą być:
- Wartością dosłowną
- Odnośnikiem-relacją do innej ramki
Atrybut posiada swoje cechy, które mówią o wartości domyślnej, zakresie, typie itd.
Język RDF - z czego się składa?
Język RDF składa się z stwierdzeń (statement) - trójka obiekt-atrybut-wartość
RDF - Zasoby
Zasoby: URL, URI, IRI
Zasoby - obiekty, o których chcemy mówić: np. ludzie. miejsca, miasta, naukowcy, studenci, uczelnie
Każdy zasób ma URI (Universal Resource Identifier):
- adres URL (internetowy)
- inny unikalny identyfikator
Będziemy przyjmowali adresy URL jako URI.
IRI są zinternacjonalizowaną wersją URI.
Zalety korzystania:
- globalny, uniwersalny w skali świata, unikalny schemat nazewnictwa
- częściowo rozwiązuje problem wieloznaczności identycznych nazw reprezentacji danych.
RDF - Właściwosci
Właściwości - opisują relacje między zasobami: np. prowadzi kurs, kieruje
Właściwości są obywatelami pierwszej klasy, tzn. są również traktowane jako zasoby (identyfikowane przez URI), mogą mieć różne charakterystyki i tworzą własną taksonomię.
RDF - Stwierdzenia
Stwierdzenia - stwierdzają posiadanie właściwości przez zasoby, a dokładniej: związek pary zasobów pewną relacją binarną.
-
Stwierdzenie jest trójką: obiekt-atrybut-wartość:
Składa się z zasobu, właściwości i wartości - Wartościami mogą być zasoby lub literałyLiterały są wartościami atomowymi (typu string)
RDF jest dostosowany do przetwarzania maszynowego, jednak do czytania przez ludzi może być niebyt zrozumiały.
W jaki sposob mozemy reprezentować stwiedzenie
Stwierdzenie możemy reprezentować jako:
- Trójkę obiekt-atrybut-wartość
- Elementarny graf z dwoma węzłami połączonymi łukiem skierowanym
- Serializacja - zapis tekstowy
W jaki sposob mozemy reprezentować zbiór stwierdzeń
- Zbiór trójek obiekt-atrybut-wartość
- Sieć semantyczna (graf)
- Dokument (np. plik) zawierający serializację zbioru trójek.
Stwierdzenia jako trójki - szerszy kontekst
- Trójkę (x, P, y) można uważać za formułę logiczną P(x,y), gdzie binarny predykat P wiąże obiekt x z obiektem y .
- Trójkę można uważać za skierowany graf z etykietowanymi węzłami i łukami:
- Skierowany od zasobu podmiotu (obiektu) stwierdzenia.
- Skierowany do przedmiotu (wartości) stwierdzenia.
- Wartość stwierdzenia może być innym zasobem lub literałem.
W jaki sposób identifikujemy zasoby i własciwosci w RDF
W RDF zarówno zasoby jak i właściwości muszą być identyfikowane przez URI.
Co to N-Triples?
N-Triples - sformalizowana konwencja ukierunkowana zarówno na czytelność jak i przetwarzanie maszynowe.
Polega na zapisie trzech elementów trójki RDF w kolejności podmiot-predykat-przedmiot, zakończonej kropką, po jednej trójce w wierszu. Każdy z elementów trójki zapisywany jest w postaci w pełni kwalifikowanych, nieskróconych URI, zapisywanych w nawiasach kątowych <>, według schematu:
Co to Turtle (Terse RDF Triple Language)
Podstawowa gramatyka Turtle jest podobna do N-Triples (w rzeczywistości oba te formaty są podzbiorami ogólnej notacji N3 (Notation3)), ale bardziej zorientowana na skróty, czytelność i wygodę.
W notacji Turtle zasoby mogą być zapisywane w postaci qnames, czyli ns
, gdzie ns jest symbolem przestrzeni nazw, a id identyfikatorem zasobu. Przestrzenie nazw związane są w Turtle z definiującymi je URI za pomocą deklaracji @prefix.
Typy danych w RDF
- typy danych stosowane są w językach programowania, aby umożliwić interpretację.
- W RDF w tym celu stosowane są literały typowane:
- Zapis ^^ wskazuje typ literału.
- W dokumentach RDF dozwolone jest korzystanie z wszelkich zewnętrznych typów danych.
- W praktyce najczęściej wykorzystywany jest system typów XML Schema, który definiuje szeroki wachlarz typów danych.
Na przykład: Boolean, liczby całkowite, zmiennoprzecinkowe, czas, daty, itp.
RDF: Predykaty binarne
-
RDF używa tylko binarnych właściwości
- Jest to ograniczenie, ponieważ często używamy predykatów z więcej niż 2 argumentami.
- Ale można je zasymulować predykatami binarnymi.
-
Przykład: referee(X,Y,Z)
X jest sędzią meczu szachowego pomiędzy graczami Y i Z- Wprowadzamy nowy pomocniczy zasób chessGame oraz predykaty binarne: ref, player1 i player2.
- Możemy teraz wyrazić referee(X,Y,Z) jako:
RDF: Właściwości
- Właściwości są specjalnym rodzajem zasobów.
- Właściwości mogą występować jako obiekty w trójkach obiekt-atrybut-wartość (stwierdzeniach).
- Możliwość ta oferuje dużą elastyczność.
- Ale jest to niezwykłe dla języków modelowania i języków programowania OO.
- Może to być mylące dla programistów modelowania semantycznego.
RDF: Reifikacja
Reifikacja (przekształcenie relacji w obiekty) jest innym dość mocnym mechanizmem.
- Może wydawać się nie na miejscu we w sumie prostym języku takim jak RDF.
- Tworzenie stwierdzeń o stwierdzeniach wprowadza poziom złożoności, który nie jest niezbędny do podstawowej warstwy Semantic Web
- Mogłoby wydawać się bardziej naturalne umieszczenie tego mechanizmy w bardziej zaawansowanych warstwach, które zapewniają bogatsze funkcje reprezentacji.
RDF Schema
Schema - rozszerzenie języka RDF, które pozwala użytkownikowi opisywać zasoby przy pomocy własnych zestawów pojęć oraz wprowadzające:
- Klasy i właściwości
- Hierarchię klas i dziedziczenia
- Hierarchię właściwości
RDF Schema nie jest odrębnym językiem tworzenia schematów dla dokumentów RDF.
Co to SPARQL
SPARQL - język zapytań RDF.
Składniowo przypomina nieco SQL, lecz w rzeczywistości język SPARQL nawiązuje do grafowego modelu danych RDF:
- SPARQL opiera się na dopasowaniu do wzorców-grafów.
- Najprostszym wzorcem-grafem jest trójka, podobna do trójki RDF ale z możliwością użycia zmiennej zamiast termu RDF na pozycji podmiotu, predykatu lub przedmiotu.
- Łączenie wzorców-trójek daje wzorzec-graf. Dokładne dopasowanie wzorca do grafu danych RDF jest niezbędne dla dopasowania wzorca.
Struktura zapytania SPARQL
Podobnie jak w SQL, zapytania SPARQL mają strukturę SELECT-FROM-WHERE:
- SELECT określa liczbę i kolejność pobieranych danych.
- FROM służy do określenia źródła przeszukiwania (opcjonalne).
- WHERE nakłada ograniczenia na możliwe rozwiązania w postaci szablonów, wzorców wykresów i ograniczeń logicznych.
Co to ontologia
Ontologia - jawna specyfikacja konceptualizacji.
Ontologia - jawny, precyzyjny i kompletny opis jakiejś części świata, zwanej dziedziną przedmiotową lub problemową.
Jaki jest cel Ontologii
Celem ontologii jest m.in. uniknięcie nieporozumień, zapewnienie, że wszyscy agenci operujący w lub na danej dziedzinie rozumieją jej elementy i własności w jednolity sposób.
Co musi zawierać Ontologia
Ontologia musi zawierać specyfikację:
- Terminologii uzgodnionej dla danej dziedziny.
- Pojęć dotyczących danej dziedziny.
- Atrybutów tych pojęć, ich własności i związków między nimi.
- Istniejących więzów na te atrybuty, własności i związki.
Powyższe elementy stanowią terminologiczną wiedzę o dziedzinie. Ontologia może również zawierać część asercyjną obejmującą:
- Wiedzę o indywiduach/obiektach istniejących w dziedzinie.
Zestawienie i opisy wszystkich tych elementów danej dziedziny bywa nazywane jej konceptualizacją. Dlatego w największym skrócie ontologię danej dziedziny nazywa się jawną specyfikacją jej konceptualizacji.