Wykład 8 Flashcards
(28 cards)
Co to związek funkcyjny?
W przypadku dwóch zmiennych. Każdej wartości zmiennej niezależnej x odpowiada tylko jedna zmienna zależna y, np. obwód kwadratu jest funkcją jego boku.
Na czym polega zależność statystyczna/korelacyjna?
W przypadku dwóch zmiennych. Określonym wartościom jednej zmiennej niezależnej x odpowiadają ściśle określone, ale średnie wartości drugiej zmiennej zależnej y. Nie zawsze tłumaczy działanie przyczynowo-skutkowe.
Analiza korelacji:
- określa siłę i kierunek związku
- współczynnik korelacji:
a) Pearsona
b) Spearmana
c) Tau Kendala - nie ma znaczenia co jest x, a co y. obydwie zmienne mają tę samą funkcję
- korelacja to współzależność, wzajemny związek
Jakie są korelacje?
➔ korelacja pozytywna, gdy ze wzrostem jednej zmiennej rośnie wartość drugiej zmiennej
➔ korelacja negatywna, gdy ze wzrostem jednej zmiennej spada wartość drugiej zmiennej
Jakie mogą być wartości współczynnika korelacji i co oznaczają?
➔ wartość współczynnika korelacji = 1 to mamy idealną korelację pozytywną
➔ wartość współczynnika korelacji = -1 to mamy idealną korelację negatywną
➔ wartość współczynnika korelacji = 0 to nie mamy żadnej korelacji
Interpretacja współczynnika korelacji:
a) wysoka korelacja nie jest ważna, jeśli nie jest istotna
b) nawet słaba korelacja jest ważna, gdy jest istotna
dla równego R korelacja jest:
0.01 nikła
0.1 - 0.29 niska
0.3 - 0.49 średnia
0.5 - 0.69 wysoka
0.7 - 0.89 bardzo wysoka
0.9 - 0.99 prawie pełna
1 pełna i istnieje związek funkcyjny
Co bada test t odnośnie korelacji?
Czy korelacja w próbie jest przypadkowa. Pozwala on ocenić odzwierciedlenie zależności dla populacji
Czy wielkość współczynnika podlega wpływom wartości skrajnych i odstających?
Tak
O czym świadczy istnienie korelacji?
- zmienna A wpływa na zmienną B
- zmienna B wpływa na zmienną A (odwrócona przyczynowość)
- zmienna A wpływa na zmienną B oraz zmienna B wpływa na zmienną A
- zmienne A i B mogą być związane ze zmienną C
- korelacja może być przypadkowa
Czy korelacja koniecznie wpływa na związek przyczynowy?
Nie
Co to błąd ekologiczny rozumowania?
➔ niepoprawne przenoszenie danych z korelacji lub obserwacji grupowych na jednostkę wchodzącą w skład tej grup, np. zimny dzień a globalne ocieplenie.
Własności współczynnika korelacji Pearsona to:
a) nie ma jednostek
b) ma wartości od -1 do +1
c) znak + oznacza że obie zmienne rosną
d) znak - oznacza że jedna zmienna maleje, a druga rośnie
e) dla r = 0 nie ma korelacji
f) dla populacji współczynnik ma przykład ro (?? what do you mean Iwetta…)
Kiedy nie należy obliczać r?
a) są dane odstające
b) dane zawierają podgrupy
c) istnieje nieliniowy związek danych
Jaki jest ciąg postępowania w analizie korelacji?
- w celu weryfikacji korelacji stawiamy H0, np. brak zależności i HA, np. jest zależność oraz przeprowadzamy test t studenta
- przed analizą należy wykonać wykres rozrzutu (x,y)
- korelację wyliczamy dla związków liniowych
Współczynnik korelacji Spearmana:
a) zastąpienie każdej wartości
konkretnym numerem
b) gdy y nie ma rozkłady normalnego
c) gdy co najmniej jedna zmienna jest w kolejności porządkowej
d) mniej wrażliwy na dane ostające
e) nieparametryczny rangowy odpowiednik Pearsona
f) możemy zastosować gdy nie ma związku liniowego, ale jest monotoniczność
g) porównanie siły związku dwóch zmiennych
h) liczony dla rang zmiennych
Współczynnik korelacji Tau Kendala:
a) wskazuje na zgodność uporządkowania dwóch zbiorów, aka miarę synchronizacji zjawiska w czasie
b) daje wartości od -1 do 1, ale znak wskazuje na kierunek zależności
c) obliczany na podstawie różnic prawdopodobieństwa ustawienia dwóch zmiennych w tym samym porządku
d) np. ocena związku sezonowości planktonu i rybek
Współczynnik wielokrotnej korelacji:
- służy do oceny siły związku między więcej niż dwoma zmiennymi
- wartości od 0 (najmniejszy związek) do 1 (największy związek)
- oznacza się literą R
- analizy parametryczne
- pierwiastek kwadratowy R2
- analiza parametryczna
Współczynnik zgodności Kendalla:
- analiza nieparametryczna
- oznacza się literą W
- współczynnik wykorzystywany jako ocena zgodności między wieloma rangami
Współczynnik korelacji cząstkowej:
- ocena związków między dwiema zmiennymi przy jednoczesnej kontroli wpływu innych zmiennych
- wysoki współczynnik korelacji cząstkowej + niski wskaźnik korelacji Pearsona = silna zależność zmiennych o silnie zaburzajacym wpływie innych zmiennych
- wysoki współczynnik korelacji cząstkowej + wysoki wskaźnik korelacji Pearsona = silna zależność zmiennych i braku wpływu innych zmiennych
Analiza regresji:
- analiza kształtu i przebiegu związku
- ma znaczenie, co jest x, a co y. określamy średnią wartość y dla konkretnego x i istotne jest odpowiednie przyporządkowanie
- polega na przewidywaniu jednej zmiennej (zależnej y) na podstawie innej zmiennej (niezależnej x)
- weryfikuje na ile zmienna y zależy od zmiennej x
- estymuje średnią potencjalną wartość dla y
Wymień założenia regresji liniowej:
- istnieje zależność x oraz y
- obserwacje w próbie są losowe, niezależne
- dla każdej wartości x istnieje rozkład normalny y opisujący zmienność, której nie da się wyjaśnić
- wariancja jest stała
- zmienna x obliczana bez błędu
Wyznaczamy regresję liniową gdy:
- zależność jest przybliżona do prostej
- jeśli y jest zależne od x
- postać modelu regresji liniowej:
1. x to zmienna niezależna, predyktor
2. a to współczynnik nachylenia (kierunkowy)
3. b to współczynnik przecięcia z y
Dopasowanie modelu:
- współczynnik determinacji R2 to miara dopasowania modelu
- jak dobrze zmienna x determinuje zmienną y
- wartości z przedziału 0:1
- dopasowanie im lepsze, tym bliższa 1
0.0 - 0.5 niezadowalające
0.5 - 0.6 słabe
0.6 - 0.8 zadowalające
0.8 - 0.9 dobre
0.9 - 1.0 bardzo dobre
Co to kwarter Anscombe’a?
To cztery zestawy danych o identycznych cechach statystycznych, które wyglądają różnie ze względu na przedstawienie graficzne.