Leíró statisztika Flashcards
(25 cards)
Nominális/kategorikus
diszkrét kategóriák, osztályok, melyek nem rendezhetőek semmilyen sorrendbe. A
kategóriákhoz rendelt számok csak a kategória azonosítására szolgálnak, matematikai, mennyiségi
jelentésük nincsen. Példa: nem, ahol 1=férfi, 2=nő
Ordinális
nagyság szerint sorrendbe rakható, a nagyobb érték
jobbat, többet jelent, de nincs információ a rangsor tagjai közötti különbségekről. Példa: elvégzett iskolák
Intervallum skála típusú
az elemek sorba rendezhetőek, az elemek közötti különbség is kifejezhető,lehet arányokat számítani, de nincs természetes nulla pont. A mértékegység megválasztható. Példa:
Celsius skála, ahol a 30°C pontosan háromszor olyan meleg, mint a 10°C és 20°C különbség van közöttük, de a nulla pont nem természetes, hiszen létezik -1°C is
Arány skála típusú
az értékek nagyság szerint sorba rendezhetőek, az elemek közötti különbség
kifejezhető, lehet arányokat számítani, és van természetes nulla pont. A mértékegység megválasztható, nem mehet mínusz alá
Leíró statisztika
A mért adathalmaz jellemzése, a mért mintát írja le de következtetéseket nem tartalmaz
Következtető statisztika
Célja a populációból választott mintából a populációra vonatkozó következtetés
Elemszám
N
Átlag
_
x, statisztikai közlésben: M
Populációátlag
µ
Medián
Mdn, az outlierek kevésbé befolyásolják
Kvartilisek
Negyedelő pontok, jele: Q
Interkvartilis terjedelem
IQR: a középső 50%, a Q2: maga a medián
Percentilisek
századoló pontok, 95% percentilisek
Módusz
Mo
Terjedelem
Legkisebb és legnagyobb érték közötti különbség
Átlagtól való eltérés
Jelölése: D, számolása: értékből-átlag majd az eredményeket négyzetre emelünk és az így megkapott eltéréseket átlagoljuk
átlagtól való négyzetes eltérés,
Jele: D2 négyzetre emelünk az átlagtól való eltérést
Variancia
Az átlagtól való négyzetes eltérést átlagoltuk vagyis összeadjuk a négyzetes eltéréseket majd itt a szabadságfokkal osztjuk el, jele: Var vagy s2
szórás
átlagtól való átlagos eltérés, a varianciának vesszük a gyökét, Jele:SD
Szabadságfok
Egymástól független szabadon változtatható tagok száma, számolása: a tagok száma mínusz az összefüggések száma df=N-1, pl: Szórás számolásánál az összefüggések száma 1 (az átlag) Így N-1 Jele: df
Relatív szórás
RSD vagy CV számolása: szórás értékét elosztjuk a mintaátlaggal
Nagy szórást okozhatja
kicsi elemszám, outlierek, csúcsosság, a tulajdonság nem stabil
Mintaátlagok standard errorja
Jelölése: SE a populációból vett minták átlagainak szórása számolása: fogjuk a populációra vonatkoztatott varianciát de mivel ezt nem tudjuk ezért a minta varianciát használjuk inkább és ezt elosztjuk az elemszámmal majd az így kapott számból gyököt vonunk
Relatív standard error
standard errort elosztjuk a mintaátlaggal, százalékban használjuk, 25% alatt elfogadható a mérés