wykład 1-3 Flashcards

1
Q

Mamy 3 rodzaje modelowania:

A

a. Statystyczne – dotyczące dziedziny statystyki
b. Matematyczne – działające na podstawie praw
c. Obliczeniowe – na podstawie obserwacji, procesów i mechanizmów

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Modele obliczeniowe (rodzaje)

A

a. Symboliczne
b. Subsymboliczne – sieciowe
c. Hybrydowe – połączenie symbolicznego i subsymbolicznego

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Model statystyczny

A

służy do budowania relacji między zmiennymi

a. Jest szczególnym rodzajem modelu matematycznego
b. Istnieje związek między zmiennymi
c. Nie musimy znać powodu, żeby wiedzieć, że istnieje jakaś relacja, która może być opisana np. za pomocą linii prostej – y = ax + b
d. FUNKCJE:
i. Może być użyteczny do weryfikacji hipotez
ii. PREDYKCJA – przewidujemy nowe dane na podst tego, co już wiemy
iii. OCENA NIEPEWNOŚCI – ilościowe oszacowanie niepewności – jak mieści się nachylenie prawdziwe

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Model matematyczny

A

a. Wychodzimy od PRAWA
i. Możemy nie oszacować, a DOKŁADNIE WYLICZYĆ, na podstawie znajomości praw czas spadania jabłka z drzewa :D

b. Jest bardzo precyzyjny, ale jest to model sfery doskonałej zamkniętej w próżni – np. w przykładzie z jabłkiem pominęliśmy opór powietrza – zatem ten model to TYLKO UPROSZCZENIE

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Model obliczeniowy

A

PROCESÓW

a. Proces, na podstawie którego coś się dzieje
b. Nie znamy prawa, ale lokalny proces i możemy obliczyć np. spadanie 10 tys jabłek – DUŻA ZŁOŻONOŚĆ ZJAWISKA – WYSTARCZAJĄCO PEWNE ESTYMACJE
c. Nie jesteśmy w stanie w całości opisać danego procesu.
d. Nie pojedyncze, a GRUPOWE OBLICZANIE

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

MODEL, TEORIA, ŚWIAT

A

a. KSZTAŁT, KOLOR, WIELKOŚĆ
b. WIELKOŚĆ to WOLNY PARAMETR MODELU – W należy do {m, d}
i. Parametr możemy ustalić dowolnie, by dopasować model do świata
c. Opisujemy pod względem tego, czy teoria opisuje trafnie świat – zostawiając jak mniej wolnych parametrów

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Jak powstaje model? – są 2 drogi

A

a. Aprioryczna
i. W postaci teorii, jakiegoś zjawiska
ii. Możemy mieć wiedzę nt. prawa na podst. Którego formułujemy model
iii. Od wiedzy → mamy prawo → tworzymy model apriori
iv. Model powstaje przez dziedziczenie – jest mechanizm wystarczający, że konkretny gen dostanie konkretne dziecko (idk what it means xd) – po prostu wiemy jak działa świat

b. Poruszanie się w funkcji liniowej w dziedzinie zlogarytmizowanej

c. Aposteriori
i. Model stworzony przez obserwacje – od obserwacji do prawa
ii. Model zapamiętywania
1. Efekt świeżości
2. Efekt pierwszeństwa
iii. Szukamy modelu, który jest: prostszy, lepiej pasuje do danych
iv. Pewna funkcja kwadratowa, potęgowa – y = ax2+bx+c → model prostszy, ma mniej wolnych parametrów
v. WADY:
1. Nie opiera się stricte na regule

MODEL A PRIORI - MATEMATYCZNY, OBLICZENIOWY
MODEL A POSTERIORI - STATYSTYCZNY

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

wolny parametr

A

to, co jest jasne i nie do ruszenia :), im ich mniej, tym lepiej

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Dopasowanie

A

i. Zabieg, który wykonujemy, proces
ii. Miara – skutek dopasowania,
1. RMSD – mówi o tym, jak zły jest model → im mniejszy, tym lepszy wynik

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Założenia będące na gruncie procesu modelowania:

A

a. Determinizm
i. Stan przyszły jest zdeterminowany przez stan aktualny i prawa zdominowane przez dany proces

b. Mechanicyzm
i. Proces da się sprowadzić do bardziej elementarnych procesów → działanie rozkładane na prostsze elementy
ii. Nie ma ‘czarnych skrzynek’

c. Humunkularyzm
i. Nic nie wyjaśnia, odsyła do skrzynki dalej
ii. Tu: jako adultomorfizm – atrybucja dorosłych cech, motywacji w stosunku do dzieci; interpretacja zachowania dziecka w terminach, które są zrozumiane dorosłym

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Ograniczenia predykatu

A

a. Nieobliczalność (nierozwiązywalność)
i. Niektóre matematyczne związki, relacje nie rozwiązania np. problem 3 ciał, problem stoku

b. Chaos (deterministyczny)
i. Przykład z prognozą pogody – zjawiska pojawiają się w systemach złożonych, których cechą jest wrażliwość na elementy początkowe

c. Eksplozja redukcjonistyczna
i. Redukcjonizm – odwołanie się do prostszych, podstawowych procesów
ii. Każdy proces można odwoływać do prostszych modeli, można zejść na niższe poziomy
iii. Zwykle nie da się zejść więcej niż 2 – 3 poziomy niżej
iv. Psychologia społeczna – poznawcza – neuropsychologia – biologia – chemia – fizyka – fizyka kwantowa

d. Nieoznaczoność
i. Zasada nieoznaczoności Heisberga
1. Istnieją takie pary wielkości, których nie da się określić
ii. Przykład ze zdjęciem – pewnych rzeczy nie da się zmierzyć na raz
1. Da się za pomocą zdjęcia określić pozycję i prędkość, ale nie obie rzeczy na raz

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Thomas Malthus – o populacji

A

populacja wzrasta, tym bardziej, niż jest liczba osobników

a. Model matematyczny rN = dN/dt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Model Lotki-Volterry

A

gatunki: łowcy i ofiary – liczność jednych zależy od liczności drugich
a. O – liczba ofiar; D – liczba drapieżników, d – pochodna
b. rO – aOD = dO/dt
c. im więcej jest O i D tym szybciej O ubywa
d. O mało i D mało – D spada, O ma się dobrze – ZMIANA PRZESTRZENI FAZOWEJ

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

CHAOS DETERMINISTYCZNY

A

Nie jesteśmy w stanie przewidzieć, co się stanie, bo nie jesteśmy w stanie tego zmierzyć

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Weryfikacja modeli

A

a. Specyfikacja modelu – stworzenie modelu nadaje dyscyplinę

i. Zalety:
1. Wymusza spójność – bo nie da się tworzyć czegoś, co jest sprzeczne
2. Wymusza precyzję – wymaga precyzji – bo nie możemy dojść do momentu, że nie wiemy, co dalej zrobić
3. Jest falsyfikowalny
ii. Wady:
1. Nie wyjaśnia zjawiska, tylko je opisuje – model powinien się opierać o dobrą teorię – model powinien się opierać o dobrą teorię!!
2. Prawo Webera – to, co postrzegamy – siła natężenia bodźca – różnica między tym, co postrzegamy – wynika ze stosunku
b. Ewaluacja modeli – jakość

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Prawo Webera-Fechnera

A

prawo wyrażające relację pomiędzy fizyczną miarą bodźca a reakcją zmysłów, np. wzroku, słuchu, węchu czy poczucia temperatury (siła wrażenia). Jest to prawo fenomenologiczne, będące wynikiem wielu obserwacji praktycznych i znajdujące wiele zastosowań technicznych.

17
Q

Identyfikowalność

A

teoretyczna możliwość oszacowania wartości parametrów modelu po wygenerowaniu nieskończonej liczby predykcji

18
Q

złożoność

A

= ELASTYCZNOŚĆ =/= SKOMPLIKOWANIE

19
Q

MIARY ZŁOŻONOŚCI:

A

a. Liczba wolnych parametrów – niezbyt dobre! – liczba wolnych parametrów nie oddaje złożoności!!!!

b. Długość opisu
i. Długość opisu jest podstawą szacowania
1. Złożoności Kołomirgowa
2. Minimalnej Długości Opisu (MDL – minimal description length)

20
Q

Wymiar Wapniaka-Czerwonienkisa VS

A

Jest on zdefiniowany jako liczność największego zbioru, który jest rozbijany przez przestrzeń hipotez. Fundamentalne twierdzenie teorii uczenia charakteryzuje potencjalnie wyuczalne przestrzenie hipotez jako te o skończonym wymiarze VC.

21
Q

Złożoność obliczeniowa

A

i. Wyszukiwanie proste – sprawdzamy po kolei (O(n/2) = 0(n))

ii. Wyszukiwanie binarne – musimy uwzględnić wartość jak szybko rosną O(log2(n))

22
Q

kryteria doboru modelu

A

falsyfikowalność
wiarygodność
interpretowalność, możliwość odniesienia parametrów do rzeczywistości
dopasowanie
złożoność
generalizowalność - gdy przewidywania można przełożyć na wyniki

23
Q
rodzaj kryteriów doboru modelu: 
falsyfikowalność
wiarygodność
interpretowalność, możliwość odniesienia parametrów do rzeczywistości
dopasowanie
złożoność
generalizowalność
A

jakościowe x3; ilościowe x3`

24
Q

ilościowe kryteria doboru modelu

A

dopasowanie
złożoność
generalizowalność - gdy przewidywania można przełożyć na wyniki

25
Q

jakościowe kryteria doboru modelu

A

falsyfikowalność
wiarygodność
interpretowalność, możliwość odniesienia parametrów do rzeczywistości

26
Q

ILOŚCIOWE MIARY DOPASOWANIA

A

jak dobrze modele da się dopasować do danych

a. IRMSD/RMSE
b. R2
c. MAKSYMALNA WIARYGODNOŚĆ
d. KORELACJA
e. X2; CHI-KWADRAT
f. G
g. DYWERGENCJA KULLBACKA-LEIBLERA

27
Q

RMSD

A

PIERWIASTEK ŚREDNIEGO KWADRATU RÓŻNICY BŁĘDU

a. Jak bardzo predykcje różnią się od rzeczywistych danych
b. Oszacowanie niezgodności

28
Q

NRMSD

A

znormalizowany pierwiastek średniego kwadratu różnicy – normalised root mean square deviation

a. Dzięki temu możemy stwierdzić, czy wartość RMSD jest mała, czyli, czy model jest dobry
b. NMSD = RMSD/y
c. Z uwzględnieniem średniej – skali
d. By wiedzieć, w jakich jednostkach błąd się wyraża

29
Q

R^2

A

WARIANCJA WYJAŚNIONA;

współczynnik determinacji, współczynnik określoności

a. (1) Wariancja niewyjaśniona; (2) zmienność wyjaśniona; (3) wariancja całkowita
b. Całkowita = niewyjaśnione + wyjaśnione
c. Współczynnik jest miarą tego, jaki procent zmienności zmiennej zależnej (objaśnianej) jest wyjaśniany za pomocą zmiennej niezależnej (czynnik zmienna objaśniająca, predyktor) bądź modelu statystycznego. Innymi słowy, współczynnik determinacji informuje nas, ile nasz model, nasz badany czynnik wyjaśnia zgromadzone dane pomiarowe (zmienną zależną). Analizowany czynnik może mieć wpływ na zmienną zależną, pytanie jak mocny jest jego wpływ.

30
Q

Sposób obliczania współczynnika korelacji wywodzi się z …

A

analizy regresji. W modelu sprawdzamy wpływ dany predyktor bądź grupa predyktorów, czynników który mają wpływ na zmienną zależną, wyjaśnianą.

31
Q

Współczynnik determinacji przyjmuje wartości

A

pomiędzy 0 a 1, jednakże najbardziej popularną formą prezentacji tego współczynnika jest jego procentowa postać.

32
Q

Zastosowanie współczynnika determinacji w analizach:

A

i. współczynnik determinacji, R-kwadrat, daje nam informację, na ile nasze badanie (nasz założony czynnik) wyjaśnia to co chcemy mierzyć
ii. służy określeniu, na ile poszczególne modele statystyczne, czynniki “dobrze” wyjaśniają to co chcemy wyjaśnić, która ze zmiennych (jeżeli badamy w badaniu kilka) lepiej wyjaśnia zmienną zależną
iii. pozwala oszacować, który z analizowanych modeli jest lepszy
iv. najczęściej stosowany w modelowaniu statystycznym, ekonometrycznym, niż w zwykłej analizie korelacji