KAD Flashcards

Question

``` Wleche CAP-Eigenschaften hat eine Relationale Datenbanksysteme DNS Bank/Finanz NoSQL Cloud? ```

Answer 1

``` Relationale Datenbanksysteme -> CA DNS -> AP Bank/Finanz -> CP NoSQL -> AP Cloud -> AP ```

Answer 2

- komplettes Dokument wird gespeichert. - manuelle Referenz. Referenzierung durch _id-Feld - DBRef. Referenzierung durch Collectionname und _id-Feld

Answer 3

- Primary - PrimaryPreferred - Secondary - SecondaryPreferred - Nearest

Answer 4

– Lesen beim Primary Node | – Falls dieser nicht verfügbar: Fehler oder Exception

Answer 5

– Lesen beim Primary Node – Falls dieser nicht verfügbar: Lesen bei Secondary Node – Verzögerung beim Lesen > maxStalenessSeconds => Client wird nicht mehr verwendet

Answer 6

– Lesen beim Secondary Node – Falls keiner verfügbar: Fehler – Ebenfalls Verwendung: maxStalenessSeconds

Answer 7

– Lesen beim Secondary Node | – Falls keiner verfügbar: Lesen beim Primary Node

Answer 8

– Lesen beim Knoten mit Node geringer Latenzzeit | – Primary und Secondary Nodes werden gleich verwendet

Answer 9

- Ascending Shard Keys - Hash Based Sharding - Range Based Sharding - Location Shard Key - Manuel Sharding

Answer 10

– Verwendung von ObjectId, o.ä. – Entspricht ungefähr Datum Eigenschaften – Neue Dokumente werden im gleichen Chunk gespeichert – D.h. alle Schreibzugriffe werden in gleichen Shard durchgeführt – Nur ein Shard wächst

Answer 11

– Bildung von Chunks durch Verwendung einer Hashfunktion – „Zufällige“ Verteilung – Gute Verteilung der Daten und Anfragen

Answer 12

- Bildung von Chunks durch numerische Bereiche

Answer 13

– Verwendung IP, Adresse o.ä.

Answer 14

Länge der kürzesten Kette von Schauspielern, die gemeinsam in einem Film mitspielen.

Answer 15

- Daten erscheinen Chronologisch - Append-Only - eine Zeile = eine Messung

Answer 16

- Skalierbarkeit (Big Data) - Hohe Schreibleistung - Analyse / Aggregierung der Daten

Answer 17

- Auswertung von Ereignisströmen zur Erkennung von voneinander abhängigen Ereignissen - Analyse von Echtzeitdaten.

Answer 18

- Speicherung der Transaktion eines Geschäfts - Operative Tätigkeit eines Unternehmens - Zeilenorientierte Speicherung sinnvoll

Answer 19

- Durchführung komplexer Analysevorhaben - Entscheidungsunterstützendes Analyseergebnis - Data Warehouse - spaltenorientierte Speicherung sinnvoll

Answer 20

- RS: Verschieben jedes Tupels | - CS: Hinzufügen einer Datei

Answer 21

- RS: Anhängen am Ende der Tabelle | - CS: Öffnen und Schreiben in jeder Datei

Answer 22

- RS: Ändern des Wertes | - CS: Öffnen, Suchen und Schreiben einer Datei

Answer 23

- RS: Lesen des betreffenden Blocks | - CS: Lesen aller Dateien

Answer 24

- RS: Lesen der gesamten Tabelle | - CS: Nur Lesen der Dateien für die relevanten Spalten

Answer 25

- Dictionary Encoding - Sparse Encoding - Lauflängenkodierung - Delta Encoding - Bit-Vector Encoding - Präfix Encoding

Answer 26

- Ersetzung häufig erscheinender Werte durch kürzere Symbole (index) Bundesland mappen auf 1 bis 17

Answer 27

- Basierend auf Dictionary Encoding | - Weglassen des am häufigsten auftretenden Identifikator

Answer 28

- Bei Wiederholung eines Wertes wird Wertepaar (Wert und Wertanzahl) gespeichert - aaaa wird auf a[4] komprimiert

Answer 29

- Unterschiede (deltas) zum vorherigen Attribut werden gespeichert - Speicherung der Position und auftreten

Answer 30

- Speicherung häufig auftretender Attribute durch Bit-Vektor

Answer 31

- Häufig auftretende Präfixe werden nur einmal gespeichert

Answer 32

- Jede Spalte kann anders komprimiert werden

Answer 33

_ Zusammensetzung der selektierten Attribute zu Tupel

Answer 34

- Bei Column Stores ist Dekomprimierung notwendig | -

Answer 35

– Vermeidung der Tupelrekonstruktion so lange wie möglich | – Bit-Vektoren als Zwischenergebnisse in Column Stores

Answer 36

- Spezielle Indexstrukturen im Hauptspeicher - Mehrbenutzersynchronisation (Für Zugriffe weniger Zeit benötigen) - Verarbeitung einer ganzen Gruppe von Transaktionen: „group commit“ - Kompaktifizierung der Datenbank - Working Set (Bruchteil der Daten sind aktiv)

Answer 37

MemTables: Schreibzugriffe werden Hauptspeicher durchgeführt Sorted Data Files - Speicherung des Memtables (flush) - Daten werden in Sorted Files gespeichert - Immutable, nur zum lesen

Answer 38

- Datenbereinigung - Löschen veralteter und gelöschter Daten - wird im Hintergrund durchgeführt

Answer 39

- Probabilistische Methode - Prüft ob der Artikel im DataSet enthalten ist oder nicht. - Ziel nicht alle Sets durchlaufen müssen.

Answer 40

– m-stelliger Bitvektor, anfangs mit 0 gefüllt – k Hash-Funktionen, Hashwerte entsprechen Position in Bitvektor – Ermittlung der k Hashwerte, wenn mind. eine 0 enthalten ist, ist Wert nicht im Filter enthalten

Answer 41

- Updates werden an neue Stelle (höhere Ebene) gespeichert - mergen der Daten in die Unteren ebenen durchführen - Merge läuft in O(n)

Answer 42

- Server erhalten Hashwert und werden zu Ring angeordnet - Datenobjekte erhalten ebenfalls Hashwerte - Zuordnung zu Server, dessen Hashwert im Uhrzeigersinn am nächsten liegt. -

Answer 43

Labeled Property Graph Model. - Knoten haben ein oder mehrere Labels zur Beschreibung der Rolle eines Knotens - Knoten und Kanten haben Properties (key-value Paare)

Answer 44

- Joins werden quasi vorberechnet und in der Datenbank gespeichert - Objekte müssen nicht über Index gesucht werden - Eine Liste über die man Iterieren kann

Answer 45

1. Datei- und Externspeicherverwaltung 2. Pufferverwaltung 3. Record- und Indexmanager 4. Cursor Verwaltung 5. Query-Übersetzung und -Optimierung

Answer 46

1. Geräteschnittstelle (Spuren, Zylinder) 2. Dateischnittstelle (Blöcke, Dateien) 3. Systempufferschnittstelle (Seiten, Segmente) 4. interne Satzschnittstelle (Sätze, B*-Bäume) 5. satzorientierte Schnittstelle (Sätze, Sets) 6. mengenorientierte Schnittstelle (Relationen, Sichten)

Answer 47

– Verwaltung externer Speichermedien – Verbergen von Geräteeigenschaften – Abbildung von physischen Blöcken auf externe Speicher, wie Magnetplatten - Blöcke sind Transfereinheit

Answer 48

Erwartungswert für die Zeit bis zum Ausfall einer Platte

Answer 49

Erwartungswert für die Zeit zur Ersetzung der Platte und der Rekonstruktion der Daten

Answer 50

Erwartungswert für die Zeit bis zu einem nicht maskierbaren Fehler

Answer 51

Mindest-Angabe in Prozent, wie viel Platz in einem Block frei bleiben für Updates

Answer 52

Mindest-Angabe in Prozent, ab wann in einem Block wieder neue Tupel gespeichert werden

Answer 53

- Statische Dateizuordnung - Dynamische Blockzuordnung - Dynamische Extent-Zuordnung

Answer 54

– Fortlaufende Speicherung von Blöcken in zusammenhängenden Speicherbereich (benachbarte Zylinder einer Magnetplatte)

Answer 55

– Beim Erzeugen von Blöcken wird Speicherplatz zugeordnet | – Adressierung eines Blocks in einer Blocktabelle

Answer 56

– Verwendung einer Extent-Tabelle zum Ablegen der Startadresse und Anzahl der Blöcke pro Extent – Zuordnung von Extents zu Dateien durch DB-Administrator

Answer 57

– Implizite Zuordnung zwischen Seiten eines Segments und Blöcken einer Datei – Verwendung in vielen DBMS

Answer 58

– Seitentabelle, die für jede Seite eines Segments einen Block zuweist – Bit-liste, die aktuelle Belegung beschreibt - hohe Flexibilität

Answer 59

Ist zuständig alle Seiten die benötigt werden im Hauptspeicher zur Verfügung zu stellen.

Answer 60

Suchverfahren 1. direkte Suche im Pufferrahmen 2. Indirekte Suche über Hilfsstrukturen (verkettete Liste, Hash-Tables)

Answer 61

- Demand-Fetching - Prefetching - FIFO - LFU (least Frequently Used) - LRU (Least Recently Used)

Answer 62

- Man erspart sich das erneute Laden der Seiten in den HS. | - Erst von links nach rechts dann rechts nach links

Answer 63

- Vorrausetzung: Sortierte Eingaben - Lineare Aufwand - Kleinerer Index läuft weiter bis Werte gleich sind.

Answer 64

- Eine Seite ist als Indexstruktur (sortiert) organisiert. | - Suche über Indexbaum nach gleichen paaren.

Answer 65

Selektivität hilft bei der Abschätzung der Größe von Zwischenresultaten. Ergebnis ist in %

Answer 66

- Datenkopien - Schnellerer Zugriff auf lokale Kopien von Remote-Tabellen - Einmalige Berechnung von Aggregationen und mehrfache Wiederverwendung

Answer 67

- Ergebnis enthält die Tupel einer Relation, die einen potenziellen Joinpartner haben

Answer 68

- Synchronisation mithilfe von Sperren

Answer 69

- ohne Sperren

KAD Flashcards

(94 cards)