Kolokvij Flashcards
Kolokvij iz Analize i Vizualizacije Podataka (15 cards)
Kod NumPy-a, tipovi podataka unutar niza mogu biti različiti?
Netočno
Inferecijalna statistika koristi se za pronalaženje veza između varijabli. Uključuje jednostruku i višestruku regresiju, a također se mogu koristiti i drugi modeli, poput logističke regresije.
Netočno
Deskriptivna analiza podataka samo opisuje skup podataka, a ne donos uzročne veze ili zaključke?
Točno
Strukture podataka koje sadrže jedinstvene elemente, a koriste se za brzo pretraživanje i uklanjanje duplikata zovu se _______
Skupovi
Funkcija u NumPy-u koju možemo koristiti za inicijalizaciju varijable kojoj ćemo kasnije dodijeliti vrijednost u kodu, a kojom stvaramo niz nula (0) u svakom elementu
zeros()
Statističke mjere koje opisuju raspršenost podataka u skupu podataka (npr. varijanca, standardna devijacija, raspon) zovu se mjere:
varijabilnosti
Analiza vremenskih podataka uključuje identifikaciju uzoraka, trendova i _________________________ u skupovima podataka
sezonskih varijacija
Tableau omogućuje_
Vizualizaciju podataka, Rad s Big Data, Povezivanje i uvoz podataka, Analizu podataka, Pripremu podataka
U deskriptivnoj analizi podataka koriste se _________________ kao što su srednja vrijednost, medijan, mod, raspon, koeficijent varijacije i sl. te grafički prikazi kao što su histogrami, kružni grafikoni, dijagrami raspršenosti
statističke mjere
Što su vremenski nizovi podataka? Od čega se sastoje? Navedi primjere vremenskih nizova podataka.
Vremenski nizovi podataka imaju vremensku komponentu u sebi, što znači da se mijenjaju s vremenom. Sadrže vremensku oznaku i vrijednost.
Primjer vremenskog niza podataka: Temperature, Dionice, mjesečna količina oborina u određenoj regiji
Pojasni metodu testiranja hipoteza u okviru inferecijalne statistike te nabroji i kratko pojasni statističe testove za testiranje hipotera.
Ako između varijabli postoji statistički značajna razlika, na njima se može vršiti testiranje hipoteze. H0 se predstavlja i pretpostavlja hipotezom koja tvrdi da postoji statistički značajna razika među varijablama.
T-Test: odnos srednjih vrijednosti dva skupa
Neupareni Test: analiza dva nezavisna skupa
ANOVA: odnos srednjih vrijednosti dva ili više skupova
jednofaktorska, dvofaktorska i višefaktorska ANOVA
Što je podatkovna znanost? Koje tehnike i alati se koriste u podrčju podatkovne znanosti? Navedi neke primjere primjene analize podataka.
Podatkovna znanost je grana znanosti koja se bavi prikupljanjem, proučavanjem i obradom podataka kako bi se dšlo do novih zaključaka.
Podatkovna znanost koristi tehnike i alate iz područja matematike, statistike, računalne znanosti i strojnog učenja za pronalazak uzoraka ili trendova u velikim količinama podataka.
Primjeri primjene podatkovne znanosti: Predviđanje potresa, personalizirana medicina, analiza sentimenta, otkrivanje prijevara i optimizacija transporta
Nabroji i kratko objasni načela dobrih grafikona.
Jednostavnost, jasan i dosljedan stil, relevantnost, precizne i odgovarajuće oznake, umjereno korištenje boja
Nabroji najčešće korištene vrste grafikona i navedi za što se pojedina vrsta najčešće koristi?
Stupčasti grafikon - prikaz kategoričkih podataka s pravokutnim stupcima, usporedba nekoliko kategorija podataka
Linijski grafikon - prikazuje podatke koji se kontinuirano mijenjanju tokom vremena
Histogram - prikaz kontinuiranih podataka u poredanim pravokutnim stupcima
Kružni grafikon - prikaz podataka i statistike u formatu lako razumljivih kružnih rezova i ilustrira numerički omjer
Povežite pojmove s odgovarajućom definicijom: Aritmetička sredina, mod, medijan
Aritmetička sredina - zbroj svih vrijednosti u skupu podataka podijeljen s brojem tih vrijednosti
Mod - predstavlja vrijednost koja se najčešće pojavljuje u skupu podataka
Medijan - središnja vrijednost skupa podataka koja dijeli skup na dvije jednake polovice