wykład 1-3 Flashcards

Question 1

Q

Mamy 3 rodzaje modelowania:

Answer

A

a. Statystyczne – dotyczące dziedziny statystyki
b. Matematyczne – działające na podstawie praw
c. Obliczeniowe – na podstawie obserwacji, procesów i mechanizmów

Question 2

Q

Modele obliczeniowe (rodzaje)

Answer

A

a. Symboliczne
b. Subsymboliczne – sieciowe
c. Hybrydowe – połączenie symbolicznego i subsymbolicznego

Question 3

Q

Model statystyczny

Answer

A

służy do budowania relacji między zmiennymi

a. Jest szczególnym rodzajem modelu matematycznego
b. Istnieje związek między zmiennymi
c. Nie musimy znać powodu, żeby wiedzieć, że istnieje jakaś relacja, która może być opisana np. za pomocą linii prostej – y = ax + b
d. FUNKCJE:
i. Może być użyteczny do weryfikacji hipotez
ii. PREDYKCJA – przewidujemy nowe dane na podst tego, co już wiemy
iii. OCENA NIEPEWNOŚCI – ilościowe oszacowanie niepewności – jak mieści się nachylenie prawdziwe

Question 4

Q

Model matematyczny

Answer

A

a. Wychodzimy od PRAWA
i. Możemy nie oszacować, a DOKŁADNIE WYLICZYĆ, na podstawie znajomości praw czas spadania jabłka z drzewa :D

b. Jest bardzo precyzyjny, ale jest to model sfery doskonałej zamkniętej w próżni – np. w przykładzie z jabłkiem pominęliśmy opór powietrza – zatem ten model to TYLKO UPROSZCZENIE

Question 5

Q

Model obliczeniowy

Answer

A

PROCESÓW

a. Proces, na podstawie którego coś się dzieje
b. Nie znamy prawa, ale lokalny proces i możemy obliczyć np. spadanie 10 tys jabłek – DUŻA ZŁOŻONOŚĆ ZJAWISKA – WYSTARCZAJĄCO PEWNE ESTYMACJE
c. Nie jesteśmy w stanie w całości opisać danego procesu.
d. Nie pojedyncze, a GRUPOWE OBLICZANIE

Question 6

Q

MODEL, TEORIA, ŚWIAT

Answer

A

a. KSZTAŁT, KOLOR, WIELKOŚĆ
b. WIELKOŚĆ to WOLNY PARAMETR MODELU – W należy do {m, d}
i. Parametr możemy ustalić dowolnie, by dopasować model do świata
c. Opisujemy pod względem tego, czy teoria opisuje trafnie świat – zostawiając jak mniej wolnych parametrów

Question 7

Q

Jak powstaje model? – są 2 drogi

Answer

A

a. Aprioryczna
i. W postaci teorii, jakiegoś zjawiska
ii. Możemy mieć wiedzę nt. prawa na podst. Którego formułujemy model
iii. Od wiedzy → mamy prawo → tworzymy model apriori
iv. Model powstaje przez dziedziczenie – jest mechanizm wystarczający, że konkretny gen dostanie konkretne dziecko (idk what it means xd) – po prostu wiemy jak działa świat

b. Poruszanie się w funkcji liniowej w dziedzinie zlogarytmizowanej

c. Aposteriori
i. Model stworzony przez obserwacje – od obserwacji do prawa
ii. Model zapamiętywania
1. Efekt świeżości
2. Efekt pierwszeństwa
iii. Szukamy modelu, który jest: prostszy, lepiej pasuje do danych
iv. Pewna funkcja kwadratowa, potęgowa – y = ax2+bx+c → model prostszy, ma mniej wolnych parametrów
v. WADY:
1. Nie opiera się stricte na regule

MODEL A PRIORI - MATEMATYCZNY, OBLICZENIOWY
MODEL A POSTERIORI - STATYSTYCZNY

Question 8

Q

wolny parametr

Answer

A

to, co jest jasne i nie do ruszenia :), im ich mniej, tym lepiej

Question 9

Q

Dopasowanie

Answer

A

i. Zabieg, który wykonujemy, proces
ii. Miara – skutek dopasowania,
1. RMSD – mówi o tym, jak zły jest model → im mniejszy, tym lepszy wynik

Question 10

Q

Założenia będące na gruncie procesu modelowania:

Answer

A

a. Determinizm
i. Stan przyszły jest zdeterminowany przez stan aktualny i prawa zdominowane przez dany proces

b. Mechanicyzm
i. Proces da się sprowadzić do bardziej elementarnych procesów → działanie rozkładane na prostsze elementy
ii. Nie ma ‘czarnych skrzynek’

c. Humunkularyzm
i. Nic nie wyjaśnia, odsyła do skrzynki dalej
ii. Tu: jako adultomorfizm – atrybucja dorosłych cech, motywacji w stosunku do dzieci; interpretacja zachowania dziecka w terminach, które są zrozumiane dorosłym

Question 11

Q

Ograniczenia predykatu

Answer

A

a. Nieobliczalność (nierozwiązywalność)
i. Niektóre matematyczne związki, relacje nie rozwiązania np. problem 3 ciał, problem stoku

b. Chaos (deterministyczny)
i. Przykład z prognozą pogody – zjawiska pojawiają się w systemach złożonych, których cechą jest wrażliwość na elementy początkowe

c. Eksplozja redukcjonistyczna
i. Redukcjonizm – odwołanie się do prostszych, podstawowych procesów
ii. Każdy proces można odwoływać do prostszych modeli, można zejść na niższe poziomy
iii. Zwykle nie da się zejść więcej niż 2 – 3 poziomy niżej
iv. Psychologia społeczna – poznawcza – neuropsychologia – biologia – chemia – fizyka – fizyka kwantowa

d. Nieoznaczoność
i. Zasada nieoznaczoności Heisberga
1. Istnieją takie pary wielkości, których nie da się określić
ii. Przykład ze zdjęciem – pewnych rzeczy nie da się zmierzyć na raz
1. Da się za pomocą zdjęcia określić pozycję i prędkość, ale nie obie rzeczy na raz

Question 12

Q

Thomas Malthus – o populacji

Answer

A

populacja wzrasta, tym bardziej, niż jest liczba osobników

a. Model matematyczny rN = dN/dt

Question 13

Q

Model Lotki-Volterry

Answer

A

gatunki: łowcy i ofiary – liczność jednych zależy od liczności drugich
a. O – liczba ofiar; D – liczba drapieżników, d – pochodna
b. rO – aOD = dO/dt
c. im więcej jest O i D tym szybciej O ubywa
d. O mało i D mało – D spada, O ma się dobrze – ZMIANA PRZESTRZENI FAZOWEJ

Question 14

Q

CHAOS DETERMINISTYCZNY

Answer

A

Nie jesteśmy w stanie przewidzieć, co się stanie, bo nie jesteśmy w stanie tego zmierzyć

Question 15

Q

Weryfikacja modeli

Answer

A

a. Specyfikacja modelu – stworzenie modelu nadaje dyscyplinę

i. Zalety:
1. Wymusza spójność – bo nie da się tworzyć czegoś, co jest sprzeczne
2. Wymusza precyzję – wymaga precyzji – bo nie możemy dojść do momentu, że nie wiemy, co dalej zrobić
3. Jest falsyfikowalny
ii. Wady:
1. Nie wyjaśnia zjawiska, tylko je opisuje – model powinien się opierać o dobrą teorię – model powinien się opierać o dobrą teorię!!
2. Prawo Webera – to, co postrzegamy – siła natężenia bodźca – różnica między tym, co postrzegamy – wynika ze stosunku
b. Ewaluacja modeli – jakość

Question 16

Q

Prawo Webera-Fechnera

Answer

A

prawo wyrażające relację pomiędzy fizyczną miarą bodźca a reakcją zmysłów, np. wzroku, słuchu, węchu czy poczucia temperatury (siła wrażenia). Jest to prawo fenomenologiczne, będące wynikiem wielu obserwacji praktycznych i znajdujące wiele zastosowań technicznych.

Question 17

Q

Identyfikowalność

Answer

A

teoretyczna możliwość oszacowania wartości parametrów modelu po wygenerowaniu nieskończonej liczby predykcji

Question 18

Q

złożoność

Answer

A

= ELASTYCZNOŚĆ =/= SKOMPLIKOWANIE

Question 19

Q

MIARY ZŁOŻONOŚCI:

Answer

A

a. Liczba wolnych parametrów – niezbyt dobre! – liczba wolnych parametrów nie oddaje złożoności!!!!

b. Długość opisu
i. Długość opisu jest podstawą szacowania
1. Złożoności Kołomirgowa
2. Minimalnej Długości Opisu (MDL – minimal description length)

Question 20

Q

Wymiar Wapniaka-Czerwonienkisa VS

Answer

A

Jest on zdefiniowany jako liczność największego zbioru, który jest rozbijany przez przestrzeń hipotez. Fundamentalne twierdzenie teorii uczenia charakteryzuje potencjalnie wyuczalne przestrzenie hipotez jako te o skończonym wymiarze VC.

Question 21

Q

Złożoność obliczeniowa

Answer

A

i. Wyszukiwanie proste – sprawdzamy po kolei (O(n/2) = 0(n))

ii. Wyszukiwanie binarne – musimy uwzględnić wartość jak szybko rosną O(log2(n))

Question 22

Q

kryteria doboru modelu

Answer

A

falsyfikowalność
wiarygodność
interpretowalność, możliwość odniesienia parametrów do rzeczywistości
dopasowanie
złożoność
generalizowalność - gdy przewidywania można przełożyć na wyniki

Question 23

Q

rodzaj kryteriów doboru modelu: 
falsyfikowalność
wiarygodność
interpretowalność, możliwość odniesienia parametrów do rzeczywistości
dopasowanie
złożoność
generalizowalność

Answer

A

jakościowe x3; ilościowe x3`

Question 24

Q

ilościowe kryteria doboru modelu

Answer

A

dopasowanie
złożoność
generalizowalność - gdy przewidywania można przełożyć na wyniki

Question 25

Q

jakościowe kryteria doboru modelu

Answer

A

falsyfikowalność
wiarygodność
interpretowalność, możliwość odniesienia parametrów do rzeczywistości

Question 26

Q

ILOŚCIOWE MIARY DOPASOWANIA

Answer

A

jak dobrze modele da się dopasować do danych

a. IRMSD/RMSE
b. R2
c. MAKSYMALNA WIARYGODNOŚĆ
d. KORELACJA
e. X2; CHI-KWADRAT
f. G
g. DYWERGENCJA KULLBACKA-LEIBLERA

Question 27

Q

RMSD

Answer

A

PIERWIASTEK ŚREDNIEGO KWADRATU RÓŻNICY BŁĘDU

a. Jak bardzo predykcje różnią się od rzeczywistych danych
b. Oszacowanie niezgodności

Question 28

Q

NRMSD

Answer

A

znormalizowany pierwiastek średniego kwadratu różnicy – normalised root mean square deviation

a. Dzięki temu możemy stwierdzić, czy wartość RMSD jest mała, czyli, czy model jest dobry
b. NMSD = RMSD/y
c. Z uwzględnieniem średniej – skali
d. By wiedzieć, w jakich jednostkach błąd się wyraża

Question 29

Q

R^2

Answer

A

WARIANCJA WYJAŚNIONA;

współczynnik determinacji, współczynnik określoności

a. (1) Wariancja niewyjaśniona; (2) zmienność wyjaśniona; (3) wariancja całkowita
b. Całkowita = niewyjaśnione + wyjaśnione
c. Współczynnik jest miarą tego, jaki procent zmienności zmiennej zależnej (objaśnianej) jest wyjaśniany za pomocą zmiennej niezależnej (czynnik zmienna objaśniająca, predyktor) bądź modelu statystycznego. Innymi słowy, współczynnik determinacji informuje nas, ile nasz model, nasz badany czynnik wyjaśnia zgromadzone dane pomiarowe (zmienną zależną). Analizowany czynnik może mieć wpływ na zmienną zależną, pytanie jak mocny jest jego wpływ.

Question 30

Q

Sposób obliczania współczynnika korelacji wywodzi się z …

Answer

A

analizy regresji. W modelu sprawdzamy wpływ dany predyktor bądź grupa predyktorów, czynników który mają wpływ na zmienną zależną, wyjaśnianą.

Question 31

Q

Współczynnik determinacji przyjmuje wartości

Answer

A

pomiędzy 0 a 1, jednakże najbardziej popularną formą prezentacji tego współczynnika jest jego procentowa postać.

Question 32

Q

Zastosowanie współczynnika determinacji w analizach:

Answer

A

i. współczynnik determinacji, R-kwadrat, daje nam informację, na ile nasze badanie (nasz założony czynnik) wyjaśnia to co chcemy mierzyć
ii. służy określeniu, na ile poszczególne modele statystyczne, czynniki “dobrze” wyjaśniają to co chcemy wyjaśnić, która ze zmiennych (jeżeli badamy w badaniu kilka) lepiej wyjaśnia zmienną zależną
iii. pozwala oszacować, który z analizowanych modeli jest lepszy
iv. najczęściej stosowany w modelowaniu statystycznym, ekonometrycznym, niż w zwykłej analizie korelacji

Brainscape's Knowledge GenomeTM

wykład 1-3 Flashcards

Brainscape's Knowledge Genome^TM