VŠA Flashcards

1
Q

Definuj viacrozmerné metódy

A

Metóda analýzy závislostí, metódy skrytých vzťahov, klasifikačné metódy

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Definuj metódy analýzy závislostí

A

RaKA a DA. Premenné možno rozdeliť na závislé/nezávislé. Cieľom je nájsť ako vplývajú nezávislé premenné na závisle premennú

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Definuj metódy skrytých vzťahov

A

PCA a FA. Premenné nemožno rozdeliť na závislé/nezávislé. Ak sa medzi premennými nachádza multikolinearita, teda sú premenné na seba navzájom korelované, tak ide také isté množstvo informácie vysvetliť aj menším počtom premenných. Ich hlavná úloha je vytvoriť premenné, ktoré nie sú korelované a ktoré vysvetľujú čo najvyšši rozptyl

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Definuj klasifikačné metódy

A

ZA a DA. Ich cieľom nie je sledovať premenné ale objekty, pričom podobné objekty zgrupiť do skupín na základe spoločných znakov čo najlepšie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Opíš PCA metódu

A

Metóda skrytých vzťahov. Ordinálna metóda, ktorá umožňuje redukovať počet dimenzií v Euklidovskom priestore tak, aby došlo k čo najmenšej strate informácie. Premenné nie sú rozdelené na závislé a nezávislé. Podmienkou jej použitia je výskyt silnej multikolinearity medzi premennými. Nové premenné, ktoré sú definované PCA sa nazývajú HK, ktoré sú nekorelované

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Typy PCA

A

Centrovaná - Vychádza z kovariačnej matice - začiatočný bod sa presúva z pôvodného bodu do centroidu objektu.
Štandardizovaná - vychádza z korelačnej matice - Začiatočný bod sa presúva z pôvodného bodu do centroidu objektu, pričom sú pôvodné hodnoty normované (ich rozptyl je 1)
Necentrovaná - Vychádzame z pôvodného bodu, začiatočný bod sa nachádza v tom istom bode, ako bol na začiatku

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Definuj komponentové skóre

A

Skóre jednotlivých objektov v novo definovanom priestore za pomoci nových premenných, HK

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Definuj vlastné vektory

A

Vyjadrujú smer vektorov, ktoré charakterizujú vplyv pôvodných znakov na komponenty. Čísla vlastných vektorov predstavujú váhy jednotlivých premenných pri tvorbe príslušného komponentu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Definuj vlastné čísla

A

Vyjadrujú smer variability, ktorá je zachytená príslušným komponentom

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Definuj FA

A

Metóda skrytých vzťahov určená na zjednodušenie štatistických analýz. Analyzuje sa štruktúra vzťahov medzi veľkou množinou premenných tak, aby bolo možné určiť spoločné faktory. FA vytvára novú premennú faktor, pričom pôvodné premenné sú lineárnou kombináciou daných faktorov

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Typy faktorov

A

Spoločný faktor - latentná premenná, ktorá vysvetľuje najmenej 2 pôvodné premenné
Špecifický faktor - latentná hypotetická premenná, ktorá vysvetľuje len jednu pôvodnú premennú

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Druhy FA

A

Prieskumná - nie je vopred určený žiaden možný vzťah o faktorovej štruktúre PP
Potvrdzujúca - Poznáme vopred určitú hypotézu o rozdelení faktorov, ktorú FA buď prijímeme alebo zamietneme

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Postup realizácie FA

A

Vyber premenných, zistenie kolinearity medzi premennými a posúdenie vhodnosti dát na vykonanie FA (KMO), samotná FA, možná rotácia faktorov pri ťažkej interpretácii. Interpretácia výsledkov a faktorového skóre

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Podobnosti FA a PCA

A

Metódy skrytých vzťahov, znižovania dimenzie. FA sa snaží vysvetliť kovariancie a korelácia pôvodných premenných pričom pri PCA je hlavným nositeľom informácie rozptyl

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Definuj klasifikačné metódy

A

Metódy, pomocou ktorých už nesledujeme premenné ale jednotlivé objekty, pričom ich hlavnou úlohou je roztriediť objekty do skupín (zhlukov) tak, aby vnútrozhluková variabilita bola čo najnižšia a medzizhluková variabilita čo najväčšia

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Definuj ZA

A

Cieľ je vytvoriť zhluky.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Aké sú miery podobnosti/nepodobnosti

A

Euklidovská metrika, Euklidovská štvorcová, Minkovského, Hammingova a Mahalanobisova

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Čím je zaujímavá Mahalanobisova metrika?

A

Nevyžaduje nekorelované údaje

19
Q

Aké poznáme zhlukovacie postupy?

A

Hierarchické a nehierarchické

20
Q

Rozdiel medzi hierarchickými a nehrierachickými postupmi?

A

Pri hierarhických dochádza k spájaniu/rozpájaniu zhlukov na každom kroku

21
Q

Aké poznáme hierarchické postupy?

A

Aglomeratívne a divízne

22
Q

Aké poznáme hierarhické metódy a ich opis?

A

Metóda najbližšieho suseda - spája tie objekty, medzi ktorými je minimálna vzdialenosť medzi ich najbližšími prvkami.
Metóda najvzdialanejšieho suseda - Spája tie objekty, medzi ktorými je maximálna vzdialenosť medzi ich najvzdialenejšími prvkami.
Metóda priemernej vzdialenosti - Spája tie objekty, medzi ktorými je minimálna priemerná vzdialenosť.
Wardova metóda - Spojí tie zhluky, medzi ktorými dochádza k najnižšiemu nárastu variability.
Mediánová metóda - Je založená na vzdialenosti ťažísk. Do zhluku sa spoja tie metódy, medzi ktorými je minimálna vzdialenosť ich ťažísk (mediánu).
Centroidná metóda - Vychádza zo štvorca euklidovskej matice, do jedného zhluku sa spoja tie objekty, medzi ktorými je minimálna vzdialenosť ich ťažísk

23
Q

Nehierarchické metódy

A

Metóda typických bodov - Zadávateľ sám na základe svojích skúseností určí, ktoré objekty majú byť typyckými predstaviteľmi novovytvorených zhlukov.
Metóda k-means -

24
Q

Hlavné prístupy na stanovenie počtu zhlukov

A

Heuristický prístup - Zvolenie počtu na základe vlastného uváženia
Index grapovania - Vyberieme ten počet, pred ktorým dochádza k najväčšej strate informácii

25
Charakterizuj DA
Skúmanie závislosti jednej kvalitatívnej premennej od niekoľkých kvantitatívnych. Umožňuje triediť nové jednotky do vopred definovaných skupín.
26
Úlohy DA
Opisná - čo najlepšie zatriediť jednotky do skupín, pomocou diskriminačnej funckie Klasifikačná - Čo najlepšie zatriediť novú jednotku do vopred definovaných skupín.
27
Predpoklady použia DA
Normálne rozdelenie údajov, presne definované skupiny štatistických jednotiek, významnosť zvolených diskriminačných premenných
28
Čo je heteroskedasticita a všetko čo o nej vieš
Predpoklad o konštantnom rozptyle
29
Čo je autokorelácia a všetko čo o nej vieš
Predpoklad o nekorelovanosti náhodných porúch
30
Čo je multikolinearita a všetko čo o nej vieš
Korelovanosť premenných modelu
31
Metódy zisťovania skrytých vzťahov?
FA, PCA
32
Marginálne rozdelenie pravdepodobnosti?
Pre náhodné premenné x1 a x2 nám hovoria o pravdepodobnosti, s akými budú premenné x1 a x2 nadobúdať rôzne hodnoty pokiaľ nevyužijeme informáciu o ich vzťahu
33
Čo je kovariačná matica
Matica, ktorá má na i-tom riadku a j-tom stĺpci kovarianciu medzi i-tým a j-tým prvkom
34
Na čo je Dixon test
Test extrémnych hodnôt, H0 v súbore nie sú extrémne hodnoty, H1 v súbore sú extrémne hodnoty
35
Podobnosť PCA a FA
Vytváranie nových premenných, zníženie dimenzie dát s čo najnižšou stratou informácie, odstránenie multikolinearity
36
Určenie počtu HK
Podľa vlastného uváženia, na základe eigenvalue (>1) alebo na základe scree plotu
37
Spoločný vs špecifický faktor
Spoločný vysvetluje najmenej 2 PP, špecifický len jednu
38
Iteračné metódy FA
Metóda maximálnej vierohodnosti, metódy nevážených najmenších štvorcov, iteračná metódy hlavných faktorov, alfa-faktorová analýzy
39
Na čo slúži rotácia faktorov?
Snaha nájsť lepšie interpretovateľnú maticu váh faktorov
40
Rozdiel medzi ZA a DA
ZA neparametrická, DA parametrická. ZA rozdeľuje objekty do skupín, ktoré vytvára. Pri DA sú skupiny dopredu už vytvorené
41
Aglomeratívny vs divízny prístup pri ZA
Aglomeratívny - Najprv je každá jednotka braná ako zhluk, na konci je každá jednotka vo veľkom spoločnom zhluku Divízny - Najprv je každá jednotka vo veľkom zhluku, následne na konci je každá jednotka samostatne v zhluku
42
Všeobecný zápis HK
Y1=ai1x1+xi2x2+aipXp
43
Určenie počtu významných zhlukov
Heuristický prístup, Index grapovania (ukazovatele kvality)