Datenbanken Flashcards

Question

Welche zwei Arten von Datenunabhängigkeit gibt es?

Answer 1

Physische Datenunabhängigkeit: Isolierung der Anwendungsprogramme von Änderungen der physischen Datenorganisation. In der Drei-Schichten-Architektur lassen Änderungen des internen Modells das konzeptuelle Modell unberührt, sie werden durch Änderung der Transformationsregeln aufgefangen. Somit bleiben auch die externen Modelle unberührt. Logische Datenunabhängigkeit: Isolierung der Anwendungsprogramme von Änderungen des konzeptuellen Modells. Bestehende externe Modelle bleiben von Änderungen wie Hinzufügen von Attributen oder neuen Beziehungen unberührt, nur die Transformationsregeln müssen ggfs abgeändert werden. Statische vs. Dynamische Datenunabhängigkeit: bei Binden zur Übersetzungszeit muss das Anwendungsprogramm nach Änderungen des internen/konzeptuellen Schemas neu übersetzt werden (statische DU), bei Binden zur Zugriffszeit nicht (dynamische DU), ist aber mit hohen Kosten verbunden.

Answer 2

Die Realwelt wird mittels (semantischem) Datenmodell beschrieben, das nicht unmittelbar vom DBS unterstützt wird, daraus wird dann ein semantisch „ärmeres“ konzeptuelles Model für das DBS abgeleitet. Es sind Konstrukte/“Bauelemente“ vorgegeben, mit denen das konzeptuelle Modell erstellt werden muss. Das Datenmodell muss mächtig genug sein, um alle wichtigen Aspekte der Realwelt beschreiben zu können und zugleich eine einfache, effiziente Implementierung auf der internen Ebene zu ermöglichen.

Answer 3

Ein Relaionenschema R(A_i,...,A_n) spezialisiert eine Relation mit Namen R und mit den paarweise verschiedenen Attributen A_1,...,A_n . Jedem Attribut Ai ist ein Wertebereich dom(A_i) zugeordnet. Die Wertemengen verschiedener Attribute können identisch sein. Die zu R(A_1,...,A_n) zugehörigen Relationen sind sämtliche Relationen des Typs R, Teilmenge dom(A_1) x dom(A_2) x...x dom(A_n)

Answer 4

1:1-, 1:n-, n:m-Beziehungen

Answer 5

Ein Schlüssel macht Entity-Typen/Tupel einer Relation unterscheidbar: die minimal nötige Menge der Attribute, die eine Relationeninstanz eindeutig beschreiben = Primary Key, weitere heißen candidate keys. Ein Fremdschlüssel ist ein Attribut oder eine Attributkombination einer Relation, welches auf einen Primärschlüssel einer anderen oder der gleichen Relation verweist. Schlüssel im Kontext Normalisierung: X ist Schlüssel von {A1, …, An} genau dann wenn X --> {A1, …, An} e F+ und {A1, …, An} ist voll funktional abhängig von X

Answer 6

Spezifikation von gewünschten Relationen durch Angabe einer Folge von Operationen, mit der die Relationen aufgebaut werden sollen. Der Benutzer wendet spezielle Operationen auf Relationen an, um seine gewünschte Relation zu konstruieren

Answer 7

- stellt stabilen Bezugspunkt für alle Anwendungen dar - stellt eine einheitliche Dokumentation wesentlicher Aspekte dar - bietet die Möglichkeit, den Gebrauch der Daten an zentraler Stelle zu kontrollieren - schafft wesentliche Voraussetzung für Datenunabhängigkeit der Anwendungsprogramme

Answer 8

Das ER kennt folgende Basiskonstrukte: - Entity-Typ - Beziehungstyp - Attribute von Entity-Typen und Beziehungstypen - beliebig viele Instanzen von Entities und Beziehungen

Answer 9

1. DBMS empfängt Befehl vom Anwendungsprogramm, ein bestimmtes Objekt eines externen Modells zu lesen 2. DBMS holt sich Definitionen des entsprechenden Objekttyps aus dem zugehörigen externen Schema 3. Mithilfe der Transformationsregeln extern/koneptuell stellt das DBMS fest, welche konzeptuellen Objekte und Beziehungen benötigt werden 4. Mit Hilfe der Transformationsregeln konzeptuelles/internes Schema stellt das DBMS fest, welche physischen Objekte zu lesen sind, es ermittelt die auszunützenden Zugriffspfade 5. DBMS übergibt Betriebssystem die Nummer der zu lesenden Speicherblöcke 6. Betriebssystem übergibt die verlangten Blöcke an das DBMS in einem Systempuffer 7. Mit Hilfe der Transformationsregeln stellt DBMS aus den vorhandenen physischen Sätzen das verlangte externe Objekt zusammen 8. DBMS übergibt das externe Objekt dem Anwendungsprogramm in seinen Arbeitsspeicher 9. Anwendungsprogramm verarbeitet die Daten

Answer 10

Mathematisch: R D1 x D2 x …x Dn ist eine n-stellige Relation über den Mengen (domains) und n ist der Grad (degree) der Relation. (Di x Dj = kartesisches Produkt)

Answer 11

Mathematisch: Ein Element r = (d1, d2, …, dn) e R (di e Di, i = 1, …, n) ist ein Tupel einer Relation R (n-Tupel), di ist i-te Komponente des Tupels.

Answer 12

Zwei Tabellen: ANGEST(NAME,BERUF,ID,OFFICENR) OFFICE(ID,STANDORD,OFFICELEITER) Wir suchen Standorte, in denen ein Programmierer beschäftigt ist. ``` SQL: SELECT STANDORT FROM ANGEST JOIN OFFICE ON ANGEST.OFFICENR=OFFICE.ID WHERE BERUF= ‘PROGRAMMIERER‘ ``` Relationenkalkül: {(OFFICE.STANDORT)|OFFICE.ID=ANGEST.OFFICENR „logisches und“ ANGEST.BERUF=‘PROGRAMMIERER‘}

Answer 13

1NF=Die Relationen, wie wir sie definiert haben, sind bereits in erster Normalform. Das bedeutet: die Werte der Wertebereiche jedes Attributes sind unteilbare Werte und nicht ihrerseits wieder Mengen oder Tupel bestehen. 2NF=Eine Relation R ist in zweiter Normalform, wenn jedes Nichtschlüsselattribut A von R voll funktional abhängig von jedem Schlüssel X von R ist. 3NF=Ein Relationenschema R mit Pd-Menge F ist in dritter Normalform, wenn für alle X➔A E p+ mit A nichtelement X gilt: X enthält einen Schlüssel für R oder A ist Schlüsselattribut.

Answer 14

Eher dem Relationenkalkül. Man spezifiziert in der Abfrage, WAS man erhalten will, nicht WIE das geschehen soll.

Answer 15

Ein Relationenschema R(A_1,...,A_n) spezifiziert eine Relation mit Namen R und mi den paarweisen verschiedenen Attributen A_1,...A_n. Jedem Attribut A_i ist ein Wertebereich dom(A_i) zugeordnet. Die Wertemengen verschiedener Attribute können natürlich auch identisch sein. Die zu R(A_i,...,A_n) gehörigen Relationen sind also sämtlich Relationen des Typs R Teilmenge dom(A_1) x dom(A_2) x...x dom(A_n).

Answer 16

``` funktionale Abhängigkeit Sei R(A_1,A_2,...,A_n) ein Relationenschema und X und Y Teilmengen von {A_1,A_2,...,A_n}. Dann ist Y funktional abhängig von X, geschrieben X->Y, wenn es keine Relation vom Typ R geben kann, in der zwei Tupel denselben Wert für X aber verschiedene Werte für Y haben ``` voll funktional abhängig: Für eine Fd-Menge F und eine funktionale Abhängigkeit X->Y Element F+ heißt Y voll funktional abhängig von X, genau dann, wenn es keine echte Teilmenge von X‘ von X gibt, so dass X‘->Y Element von F+ Beispiel: Adresse voll funktional abhängig von Lieferant aber nicht von {Lieferant, Artikel}

Answer 17

- Sie soll den die gleichzeitige Nutzung mehrerer Nutzer ermöglichen - in ungeplanter Weise abfragbar sein (flexibel)

Answer 18

Die interne Schicht regelt die interne, physische Organisation der Daten: genaue Festlegungen zu Repräsentation von Attributwerten, Aufbau gespeicherter Sätze, Zugriffsmethoden auf Sätze, zusätzliche Zugriffspfade (Indexe, Verkettungen, usw.). Einige dieser Entwurfsentscheidungen sind in kommerziellen DB schon gegeben.

Answer 19

Zur Verbesserung des Systemverhaltens kann es notwendig sein, die physische Datenorganisation zu verändern. Wenn Änderungen der internen Sicht durchgeführt werden müssen, so müssen auch die Transformationsregeln der konzeptuellen/internen Schicht angepasst werden.

Answer 20

Wenn sich an der Struktur des Unternehmens etwas ändert, das die Daten betrifft, muss dies auch auf der konzeptuellen Ebene abgebildet werden

Answer 21

SQL, Relationenalgebra, Relationenkalkül

Answer 22

Sie setzt eine Query ab, die die DB nach bestimmten Kriterien durchsucht und ein entsprechendes Ergebnis zurückliefert

Answer 23

Das ER-Modell ist ein semantisches Modell, d.h. es ist dafür da, Dinge der Realwelt möglichst getreu abzubilden, Relationenalgebra und -kalkül sind mathematische Möglichkeiten, das in ein Datenmodell umzusetzen. ???

Answer 24

Durch Transaktionsmanagement ...

Answer 25

Es ist Aufgabe des Transaktionsmanagement, für die Unteilbarkeit und Isolation ablaufender Transaktionen (Folge von Befehlen die vollständig und korrekt ausgeführt werden müssen) zu sorgen.

Answer 26

Um Daten möglichst effizient (= auf schnellstem Weg) bearbeiten zu können. (Schätzung??)

Answer 27

Der große Unterschied ist, dass in einer DB eine gemeinsame Datenbasis für alle Benutzer vorhanden ist, und diese durch das DBMS auch vor dem direkten Zugriff des Anwenders "geschützt" ist. Probleme: Redundanz, Inkonsistenz, Daten-Programm-Abhängigkeit, Inflexibilität

Answer 28

Das Baugerüst, wonach etwas, z.B. ein Unternehmen, aus der Realwelt auf Datenebene abgebildet wird. Es sind dabei Konstrukte/“Bauelemente“ vorgegeben, mit denen das konzeptuelle Modell erstellt werden muss. Das Datenmodell muss mächtig genug sein, um alle wichtigen Aspekte der Realwelt beschreiben zu können und zugleich eine einfache, effiziente Implementierung auf der internen Ebene zu ermöglichen.

Answer 29

Interne Sicht (physische Datenorganisation), logische Gesamtsicht, externe Sichten der Benutzer

Answer 30

Weil nicht jeder Nutzer die selben Daten benötigt oder nutzen darf/soll. Ein Personaler muss z.B. auf die Gehaltsdaten seiner Mitarbeiter zugreifen können, ein Mitarbeiter braucht die Daten zu seinen Projekten, aber nicht zu anderen, etc.

Answer 31

? Transformationsregeln beschreiben, wie man aus einem konzeptuellen Modell ein internes bzw. externes Modell herleitet. Werden Änderungen an der Internen Ebene vorgenommen, so müssen nur die Transformationsregeln angepasst werden.

Answer 32

Die physische Datenunabhängigkeit, die Anwendungsprogramme von Änderungen der physischen Datenorganisation isoliert. In der Drei-Schichten-Architektur lassen Änderungen des internen Modells das konzeptuelle Modell unberührt, sie werden durch Änderung der Transformationsregeln aufgefangen. Somit bleiben auch die externen Modelle unberührt.

Answer 33

- Anforderungsanalyse - Konzeptueller Entwurf - Wahl des DBMS - Abbildung des Entwurfs auf Datenmodell - Physischer Datenbankentwurf - Implementierung des Datenbanksysstems und Tuning

Answer 34

Der Benutzer formuliert seine Zugriffswünsche in den Begriffen seines externen Modells. Das DBMS übernimm die notwendigen Umsetzungen, ermittelt die Objekte, die von den Speichen zu lesen sind und übergibt die gewünschten Daten in der entsprechenden Form an das Anwendungsprogramm

Answer 35

Jede Ebene der Daten modelliert die Unternehmensdaten auf einem anderen Abstraktionsniveau. Diese Modelle der Datenwelt des Unternehmens werden mi Hilfe sogenannter Datenbeschreibungssprachen in einer für das DBMS verständlichen Form beschrieben. Diese Beschreibung heißt dann Schema. Es gibt - verschiedene externe Schemata - konzeptuelles Schema - internes Schema

Answer 36

externes Modell: Sichten der Benutzer konzeptuelles Modell: Repräsentiert die logische Gesamtsicht der Daten und ihrer Beziehungen untereinander internes Modell: physischen Datenorganisation genaue Festlegungen zu Repräsentation von Attributwerten, Aufbau gespeicherter Sätze, Zugriffsmethoden auf Sätze, zusätzliche Zugriffspfade

Answer 37

Verbund (Join)

Answer 38

1. Selektionen auf dem gleichen Operanden werden zu komplexen Selektionen zusammengefasst. 2. Selektionen werden möglichst zu den Blattknoten des O-Baumes verschoben, also möglichst früh ausgeführt. Warum ist das wichtig? In der Regel fallen bei einer Selektion eine Reihe von Tupeln weg, so dass nachfolgende OPs auf viel kleineren Tupelmengen arbeiten müssen. 3. Projektionen, die keine Eliminierung von Duplikaten erfordern, kommen gleich nach Selektionen 4. Dagegen kommen Projektionen, die die Eliminierung von Duplikaten erfordern, so weit wie möglich zur Wurzel 5. Suche gemeinsame Teilbäume. Ist das Ergebnis eine Relation, lohnt es sich, die Zwischenrelation abzuspeichern.

Answer 39

? Bei Natural-Join-verknüpften Relationen besteht bereits ein Identifikator, nämlich der, mit dem der Join überhaupt hergestellt worden ist. Anhand dieses Schlüssels, kann die Relation bereits eindeutig identifiziert werden, somit ist der Aufbau eines weiteren Indizes nicht notwendig

Answer 40

gemäß den natürlichen Zusammenhängen in der Anwendungswelt strukturiert, nicht danach, wie Anwendungen die Daten benötigen.

Answer 41

in der konzeptuellen Schicht

Answer 42

Logische Gesamtschicht- Konzeptuelles Modell: Beschreibung der Gesamtheit der Unternehmensdaten inklusive ihrer Beziehungen zueinander Ferner werden auch Integritätsbedingungen und Zugriffsrechte dokumentiert.

Answer 43

? Widerspruchsfreiheit In relationalen Datenbanken versteht man unter Konsistenz die Integrität von Daten. Beispiele von Inkonsistenz: Referenz ins Leere, Kontobuchungsfehler, negatives Alter, nichtkonsistente Speicherung von Daten.

Answer 44

= atomicity, consistency, isolation, durability. So können die Eigenschaften einer Transaktion beschrieben werden. Im Detail: Unteilbarkeit (atomicity) Eine Transaktion ist eine unteilbare Verarbeitungseinheit; sie wird entweder ganz oder überhaupt nicht ausgeführt. Konsistenz (consistency) Eine korrekte Ausführung der Transaktion führt die DB von einem konsistenten zu einem konsistenten Zustand. Isolation (isolation) Eine Transaktion muss so ablaufen, als sei sie die einzige im System. Zwischenzustände (die ja inkonsistent sein können) düfen für andere Transaktionen nicht sichtbar sein. Dauerhaftigkeit (durability) Ergebnisse einer erfolgreich beendeten Transaktion sind dauerhaft, d.h. überleben jeden nachfolgenden Fehler.

Answer 45

Das Konzept besagt ja, dass wir u.a. auch mit Programmen arbeiten können, die größer als der RAM sind, indem wir pages auf den Sekundärspeicher auslagern und bei Bedarf in den Arbeitsspeicher holen (mit paging). Bei Datenbanken ist die Arbeitsweise ähnlich: Angeforderte Daten sind nach Möglichkeit bereits im Cache des Arbeitsspeichers – welche pages das sind, entscheidet der Systempuffer-Manager. Das Problem bei beiden Konzepten: Welche Seiten dürfen überschrieben werden, wenn wir Platz im Cache brauchen? Seitenmanager in DBS müssen allerdings mehr leisten: Siehe pinned pages und forced output

Answer 46

Im Zusammenspiel mit der Recovery (Wiederherstellung nach Fehlern) dürfen Seiten nicht beliebig in die Datenbank geschrieben werden. Solche Seiten heißen pinned (festgeheftet). Beispielsweise ist Recovery nach einem Fehler sehr einfach, wenn die betroffenen Seiten noch nicht in die Datenbank zurückgeschrieben wurden.

Answer 47

Ebenfalls im Zusammenhang mit der Recovery müssen gelegentlich Seiten auf den Externspeicher zurückgeschrieben werden, obwohl der Platz im Systempuffer gar nicht benötigt wird. Diese Situation nennt man forced output (zwangsweises Schreiben).

Answer 48

Mithilfe der Transaktionsregeln konzeptuell/intern

Answer 49

Das Datenbankmanagementsystem

Answer 50

Binden zur Laufzeit- Anpassung von transformationsregeln

Answer 51

Aufgrund von Recovery sind zwei zusätzlich Anforderungen an das paging bzgl. Datenbanken zu beachten: - Pinned Pages: Auf die Datenbank darf nicht beliebig geschrieben werden - Forced Output: Manchmal müssen Seiten auf den Sekundärspeicher ausgelagert werden, obwohl im Hauptspeicher noch genügend Platz ist.

Answer 52

Auf einen Block

Answer 53

Der Verbund

Answer 54

Ja Entities und Beziehungen besitzen Attribute

Answer 55

Transaktionen sind Folgen von Anweisungen die entweder ganz oder gar nicht durchgeführt werden müssen. Sie müssen das ACID-Prinzip erfüllen: A = Atomarity = Unteilbar C = Consistency - Nach Transaktion ist DB noch konsistent I = Isolation - Soll durchgeführt werden, als wäre sie die einzige Transaktion im System D = Durability - Dauerhaftigkeit - vollständig durchgeführte Transaktion muss jede weitere Transaktion überleben

Answer 56

Der Systempuffermanager ist eine Schicht im DBMS. Er stellt für die oberen Schichten die Seiten für den Zugriff zur Verfügung.

Answer 57

Ja, ist er, auf ihn kommen jedoch noch weitere Anforderungen aufgrund Recovery zu: Pinned Pages Forced Output

Answer 58

Primärschlüssel - Identifiziert die Relation eindeutig | Fremdschlüssel - Schlüssel, der auf eine andere Relation referenziert

Answer 59

SELECT * FROM products LEFT JOIN customers USING (id) WHERE id="17"

Answer 60

Cursor sind ein Hilfsmittel, um bei der imperativen Programmierung (die tupel-orientiert ist) einen Zugriff auf die Ergebnisse der SQL-Queries (die mengenorientiert sind) zu erhalten. Nach seiner Definition wird der Cursor in der OPEN-Anweisung geöffnet, danach werden die Elemente der Ergebnismenge in einer Folge von FETCH-Anweisungen durchlaufen. Mit FOUND wird überprüft, ob die Ergebnismenge schon vollständig durchlaufen wurde.

Answer 61

Eine Relation R ist in zweiter Normalform, wenn jedes Nichtschlüsselattribut von R voll funktional abhängig von jedem Schlüssel X von R ist. Wenn nicht in 2NF, resultieren daraus Anomalien (zum Beispiel Lösch-Anomalie, d.h. wenn das letzte Feld eines bestimmten Schlüsselattributs gelöscht wird, verlieren wir auch die Informationen über davon funktional abhängige weitere Attribute). Wie geht das: Normalisierungsschritt: partielle Abhängigkeiten eliminieren! 1NF-Relation zerlegen, partielle abhängige Attribute in neue Relation übertragen, mit einer Kopie der Attribute, von denen sie abhängig sind. -> Erhalten der 2NF. Anomalien können aber immer noch auftreten – bei indirekten Abhängigkeiten vom Schlüssel! Dann brauch man die dritte Normalform.

Answer 62

(Fangfrage) Die Relationen, wie wir sie definiert haben, sind bereits in erster Normalform. Laut Def. sind die Werte der Wertebereiche jedes Attributs unteilbare Werte und bestehen nicht ihrerseits wieder aus Mengen oder Tupeln

Answer 63

- muss Datendefinitionen akzeptieren und interpretieren können. Diese müssen auch für den Nutzer abfragbar sein (= Metadaten). Werden im Katalog/Data Dictionary des DBMS zusammengefasst. - soll Integritätsverletzungen verhindern - Datensicherung (Recovery): nach Fehlern soll das DBMS die DB wieder in konsistenten Zustand versetzen - Koordination gleichzeitig auf der DB arbeitender Benutzer - Schutz der Daten gegen unberechtigten Zugriff

Answer 64

dient dem DBMS zur Speicherung der Verwaltungsdaten der DB (Schema-Informationen, Sichten, Zugriffsrechte…) und dem Anwendungsprogrammierer zur Suche nach Informationen über gespeicherte Daten und deren Struktur (Schema-Informationen) und zur Analyse bei Leistungsproblemen = somit eine Datenbank für sich selbst. Heute mehr und mehr ein Repository. Ein Data Dictionary System verwaltet: Beschreibung der Daten, Angaben der Beziehungen zwischen den Daten, Beschreibungen der Programme (Transaktionen), Angaben, welche Programme welche Daten nutzen, Konsistenzbedingungen, Angaben über Zugriffsbefugnisse, Entwurfsdaten, Verantwortlichkeiten, Entwurfsdokumente. An diese Vereinbarungen muss sich jeder Entwickler halten.

Datenbanken Flashcards

(97 cards)