hackmd Flashcards

Question

Klastrowanie miedzyplikowe

Answer 1

polega na umieszczaniu na stronie obok siebie rekordów pochodzących z więcej niż jednej tabeli i umieszczaniu na stronie obok siebie rekordów pochodzących z więcej niż jednego pliku.

Answer 2

proces dzielenia danych na mniejsze, zarządzalne jednostki, zwane partycjami. Partycjonowanie pozwala na zwiększenie efektywności operacji na dużych zbiorach danych, poprawę wydajności zapytań oraz łatwiejsze zarządzanie danymi.

Answer 3

-Lepsza wydajność zapytań - Dzięki partycjonowaniu, zapytania dotyczące małych zestawów danych (np. konkretnego zakresu dat) mogą być szybciej realizowane, ponieważ system bazodanowy może przetwarzać tylko odpowiednią partycję, a nie całą tabelę. -Zwiększona skalowalność - W przypadku dużych baz danych partycjonowanie umożliwia rozłożenie danych na różnych serwerach, co poprawia wydajność systemu i umożliwia łatwiejsze zarządzanie ogromnymi zbiorami danych. -Ułatwione zarządzanie danymi - Partycjonowanie pozwala na łatwiejszą archiwizację, usuwanie lub przenoszenie danych. Może to być szczególnie przydatne w sytuacjach, gdy dane są usuwane lub archiwizowane na podstawie określonych kryteriów (np. starsze dane mogą być przenoszone do mniej wydajnych magazynów). -Poprawa równoważenia obciążenia - Możliwość rozdzielania danych między różne serwery czy dyski fizyczne poprawia wydajność i równoważy obciążenie.

Answer 4

Złożoność zarządzania - Partycjonowanie wymaga odpowiedniego zaplanowania i zarządzania, aby zapewnić efektywność. Złe zaprojektowanie partycji może prowadzić do problemów z wydajnością lub zarządzaniem danymi. Koszt operacji - Złożone zapytania, które wymagają przetwarzania wielu partycji, mogą być mniej wydajne niż zapytania działające na pojedynczych tabelach, ale skanują mniejszą ilość danych. Złożoność migracji danych - Zmiana struktury partycji w dużych bazach danych lub migracja danych pomiędzy partycjami może być czasochłonna i wymagać zaawansowanego planowania.

Answer 5

ciąg operacji wykonywanych na bazie, które to operacje są niepodzielne i muszą być wykonane w całości.

Answer 6

**READ UNCOMMITTED**, która nie zakłada blok i transakcja jest w stanie odczytać zmodyfikowane dane, ale niezapisane jeszcze fizycznie **READ COMMITTED**, która nie pozwala transakcji na odczyt niezapisanych danych **REPEATABLE READ**, która podaje te same dane transakcji wykonującej powtarzające się zapytania **SERIALIZABLE**, poziom spełniający postulaty ACID (I - isolation: transakcja nic nie wie o innych transakcjach i nie bierze ich pod uwagę, podobnie jej czynności nie są widoczne dla innych transakcji, aż do zakończenia jej działania), zakłada największą ilość blokad praktycznie uniemożliwiając jednoczesny dostęp kilku transakcji do tych samych zasobów Niektóre systemy wprowadzają także dodatkowe poziomy izolacji w celu zwiększenia wydajności (np. SNAPSHOT w MSSQL Server 2005).

Answer 7

Zamek typu X (Exclusive Lock) **Zamek wyłączny **(ang. Exclusive Lock) oznacza, że dany zasób (np. rekord w bazie danych) jest zablokowany do wyłącznego użytku przez jedną transakcję lub proces. Oznacza to, że żadna inna transakcja nie może jednocześnie uzyskać dostępu do tego zasobu — ani w trybie odczytu, ani zapisu. Zamek typu X blokuje dostęp do danych przez inne procesy do momentu, kiedy transakcja zwolni zamek, co zapewnia integralność operacji zapisu na tym zasobie. Zamek typu S (Shared Lock) **Zamek współdzielony** (ang. Shared Lock) pozwala na równoczesny dostęp do zasobu, ale tylko w trybie odczytu. Oznacza to, że wiele transakcji może jednocześnie odczytywać ten sam zasób, ale nie mogą wprowadzać do niego zmian. Zamek typu S blokuje operacje zapisu na danych przez inne transakcje, ale nie blokuje operacji odczytu przez innych użytkowników. Zamek typu S jest stosowany w przypadkach, gdy dane muszą zostać tylko odczytane, a nie modyfikowane, co pozwala na współbieżny dostęp do tych samych danych.

Answer 8

Ziarnistość zakładania zamków odnosi się do poziomu, na którym zamek jest stosowany w systemie zarządzania bazą danych lub systemie współbieżnym.

Answer 9

specjalna procedura składowana, która jest automatycznie wykonywana (wyzwalana) w odpowiedzi na określone zdarzenia związane z danymi w bazie danych. Wyzwalacze są zazwyczaj powiązane z operacjami na danych, takimi jak INSERT, UPDATE lub DELETE, i pozwalają na automatyczne reagowanie na te zmiany, takie jak logowanie, walidacja danych, audyt czy też wykonywanie dodatkowych operacji w bazie. ``` CREATE TRIGGER Trg_AfterInsert ON Produkty AFTER INSERT AS BEGIN -- Przykładowa akcja: wstawienie logu po dodaniu nowego rekordu do tabeli Produkty INSERT INTO Logi (Operacja, Data, Opis) SELECT 'INSERT', GETDATE(), 'Dodano nowy produkt' FROM INSERTED; END; ```

Answer 10

mechanizm umożliwiający iterację (przechodzenie) po zbiorach danych w SQL Server. Zamiast przetwarzać całą tabelę w jednym zapytaniu, kursor pozwala na przetwarzanie rekordów pojedynczo. Kursory są przydatne, gdy trzeba wykonać skomplikowane operacje, które nie mogą być zrealizowane przez jedno zapytanie, lub gdy zachodzi potrzeba iteracji po zestawie wyników w sposób bardziej kontrolowany.

Answer 11

Funkcje okna - uzywają OVER(ORDER BY) LAG- poprzedni wiersz Lead- nastepny wiersz

Answer 12

SQL Injection to atak na bazę danych przy użyciu nieprawidłowo napisanej aplikacji, która nie sprawdza (lub sprawdza niedostatecznie dobrze) dane wprowadzane w aplikacji przez użytkownika. Atakujący stosuje kod SQL, który wykona w bazie niedozwoloną akcję. Atakujący może uzyskać nieuprawniony dostęp do zasobów bazy danych lub nawet systemowych. Sposoby ochrony: Używanie konta o minimalnych uprawnieniach Kontrolowanie danych wprowadzanych przez użytkowników i odrzucanie tych nieprawidłowych oraz usuwanie znaków pochodzących z SQL Brak wyświetlania domyślnych komunikatów o błędach Używanie procedur składowanych z parametrami Unikanie konkatencji do tworzenia zapytań SQL w kodzie

Answer 13

Przyrost pliku danych to proces rozszerzania pojemności pliku danych (o zadany procent), w przypadku, gdy dotychczasowa jego wielkość została już osiągnięta. Proces powiększania rozmiaru

Answer 14

Obiektowa baza danych - jest zbiorem obiektów, których zachowanie się i stan oraz związki są określone zgodnie z obiektowym modelem danych. Zalety: -współpraca z aplikacjami opartymi na obiektowych językach programowania -łatwy dostęp i obsługa danych z punktu widzenia programisty -bardziej “naturalny” sposób składowania danych pozwala na szybkie i łatwe tworzenie aplikacji obiektowych -tworzenie dowolnych typów danych i złożonych struktur -modelowanie złożonych zależności pomiędzy obiektami przy zachowaniu dużej wydajności -zastosowanie w systemach rozproszonych -dobra skalowalność (system działa szybko nawet przy dużej ilości danych) Wady: -większa zależność danych od aplikacji (w porównaniu do relacyjnych baz danych) - problem współużytkowania danych przez różne aplikacje (rozwiązanie nieuniwersalne) -brak prostoty obsługi przy bardziej złożonych strukturach danych -problem synchronizacji danych (tylko w niektórych przypadkach) -produkt nowy, niedojrzały (w porównaniu do relacyjnych baz danych), aczkolwiek dobrze rozwinięty; brak dominacji na rynku i wiarygodności producentów

Answer 15

Grafowa baza danych - baza danych wykorzystująca struktury grafów z węzłami, krawędziami i własnościami do przedstawiania i przechowywania danych do obsługi zapytań. Struktury w grafowej bazie danych: Węzeł - zwykle przechowujemy w nich informacje o encjach. Relacja - łączą ze sobą węzły, tworząc strukturę grafu. Zawsze mają swój typ, kierunek, a także węzeł początkowy i końcowy. Mogą tworzyć pętle wtedy, gdy węzeł początkowy jest węzłem końcowym. Trzeba podkreślić zasadniczą różnicę, pomiędzy pojęciem relacji w modelach relacyjnym i grafowym. W modelu relacyjnym, relacja to dwuwymiarowa tabela, która operuje na prostych typach danych, gdzie każda relacja składa się z atrybutów (kolumn) i krotek (wierszy). W modelu grafowym, relacja to swego rodzaju sposób powiązania encji ze światem. Tak jak w grafie, krawędź to uporządkowana para wierzchołków, tak w modelu grafowym, relacja może zachodzić tylko pomiędzy encjami. Relacja musi łączyć parę encji, czyli nigdy nie może być „dyndająca”. Własność - zarówno węzły, jak i relacje są kontenerami na własności, które właściwie są parami klucz-wartość. Węzły mogą posiadać jedną lub więcej własności, podobnie do tabel w modelu relacyjnym, które mogą mieć jeden lub więcej atrybutów. Relacje także mogą posiadać własności, które określają moc, wagę lub jakość danej relacji. Dzięki ich obecności, możliwe jest dokładniejsze określenie szukanych wzorców, podczas zadawania pytań i trawersowania grafu. Etykieta - są nadawane węzłom i stosowane do indeksowania. Etykiety zostały zaprojektowane po to, by umożliwić szybkie i efektywne tworzenie podgrafów.

Answer 16

Zalety grafowej bazy danych: łatwe zmiany struktury, elastyczność, skalowalność, wydajność, łatwo modelowania, zastosowanie w bazach zorientowanych obiektowo, również w przedstawianiu złożonych sieci Wady grafowej bazy danych: Nieefektywne skalowanie poziome, Nieefektywne aktualizowanie wszystkich węzłów, Nie istnieje standardowy język zapytań. Język zależy od używanej platformy. Grafy są nieodpowiednie dla systemów opartych na transakcjach. Baza użytkowników jest niewielka, co utrudnia znalezienie wsparcia w przypadku napotkania problemu.

Answer 17

Hierarchiczna baza danych W hierarchicznym modelu bazy danych dane ułożone są w strukturę o kształcie odwróconego drzewa. Każdy rekord związany jest z dokładnie jednym rekordem nadrzędnym (rodzicem). Dane grupowane są w formie kolejnych poziomów drzewa, począwszy od korzenia (zbioru podstawowego) poprzez rozgałęzienia (kolejne podzbiory) aż do liści. Wyszukiwanie w takim modelu polega na zagłębianiu się w strukturę drzewa poprzez kolejne zbiory danych. Przykładem hierarchicznej organizacji danych jest system plików w komputerze (dyski, katalogi, podkatalogi i pliki). Zalety: szybkie wyszukiwanie danych danej klasy, poprzez ścisłe powiązania pomiędzy tabelami (nadrzędna-podrzędna) w przypadku usnięcia rekordu, usunięci zostają też wszyscy jego potomkowie (rekordy z niego wychodzące) - integralność odwołań Wady: brak możliwości budowania relacji pomiędzy rekordami różnych drzew tworzenie nadmiarowych danych problemy z dodawaniem rekordów do tabel podrzędnych (jeśli nie ma odpowiedniego wpisu w tabeli-rodzicu)

Answer 18

Hurtownia danych to specjalny rodzaj bazy danych, która umożliwia raportowanie i analizowanie zawartych w niej danych. Składa się ona z tabel zorganizowanych w zestawy do analizy (data mart). W skład jej struktury wchodzą: tabele faktów (analiza tych danych jest właśnie celem biznesowym) tabele wymiarów (określają kryteria analizy) tabele pomocnicze (wykorzystywane przy imporcie danych do tabel faktów i wymiarów) Pojedynczy wymiar może mieć budowę opartą o poniższe struktury: strukturę gwiazdy strukturę płatka śniegu hierarchię rodzic-dziecko

Answer 19

Mówimy, że wymiar ma strukturę gwiazdy, jeżeli jego dane są przechowywane w jednej tabeli. Nazwa gwiazda bierze się z graficznej ilustracji pojemnika data mart, którego wszystkie wymiary mają strukturę gwiazdy - układ tabel na diagramie przypomina gwiazdę. Przykładem typowego wymiaru o strukturze gwiazdy jest zapisany w jednej tabeli wymiar Czas, który jest jednym z najczęściej spotykanych wymiarów. Z kolei strukturę płatka śniegu posiada wymiar, którego hierarchia jest stworzona z kilku tabel. Podobnie, jak w przypadku gwiazdy, nazwa bierze się od układu tabel na diagramie pojemnika data mart, którego wymiary mają strukturę płatka śniegu. Przykład: jeśli wymiar Produkt jest zbudowany przy użyciu dwóch tabel - Kategoria i Produkt - które są ze sobą powiązane związkiem, mówimy, że wymiar ma strukturę płatka śniegu.

Answer 20

Hierarchia rodzic-dziecko jest wykorzystana do stworzenia wymiarów, które mają za zadanie obrazowanie zależności hierarchiczne między członkami wymiaru (rekordami w tabeli wymiaru). Przykładem może być wymiar Pracownik, którego struktura oparta jest o hierarchię firmy (każdy pracownik może mieć szefa i podwładnych). Implementacją takiego wymiaru jest pojedyncza tabela i związek unarny (związek, w którym uczestniczą dwie kolumny jednej tabeli).

Answer 21

ETL (Extract Transform Load) - to narzędzia do transferu danych. Wykorzystuje się je do importu danych do hurtowni danych. Etapy importu: Import danych do tabel wymiarów Import danych do tabeli przejściowej. Służy ona do wypełnienia tabeli faktów. Import danych do tabeli faktów na podstawie danych z tabeli przejściowej i wymiarów.

Answer 22

OLAP (On-line Analytical Processing) - charakteryzuje się natomiast stosunkowo nielicznymi, ale za to złożonymi transakcjami odczytu. Miarą efektywności jest czas odpowiedzi. Powszechnie wykorzystuje się go w technikach związanych z Data Miningiem. OLTP (On-line Transaction Processing) - charakteryzuje się dużą ilością prostych transakcji zapisu i odczytu. Główny nacisk kładziony jest na zachowanie integralności danych w środowisku wieloostępowym oraz na efektywność mierzoną liczbą transakcji w danej jednostce czasu

Answer 23

**READ UNCOMMITTED** – możliwy brudny odczyt, odczyt nie dający się powtórzyć i odczyt widmo. Problemem tutaj jest to, że chcesz wykonać jedną transakcje na jakiś danych, ale te dane w między czasie zostały już uprzednio zmodyfikowane przez inną. **READ COMMITTED** – niemożliwy brudny odczyt, możliwy odczyt niedający się powtórzyć i odczyt widmo. W tym przypadku nie możesz modyfikować danych, na których założona jest już inna transakcja. Jednak wciąż możliwy jest ich odczyt, gdy są one zmieniane przez drugą transakcje, co może prowadzić do braku spójności. **REPEATABLE READ** – niemożliwy brudny odczyt i odczyt niedający się powtórzyć, możliwy odczyt widmo. Domyślny poziom dla większości baz danych. Jest on bardzo podobny do poprzedniej opcji, z tą różnicą, że transakcja odczytuje dane sprzed jej rozpoczęcia, co ułatwia zachowanie spójności. **SERIALIZABLE** – żaden z niepożądanych odczytów nie jest możliwy. W praktyce oznacza to zablokowanie dostępu do całej tabeli. Niemożliwa jest modyfikacja i odczyt aż do momentu zakończenia transakcji.

hackmd Flashcards

(47 cards)