Statistica descrittiva e inferenziale Flashcards
(30 cards)
Cos’è una variabile stocastica?
Una variabile che assume valori casuali, non prevedibili neanche conoscendo i valori precedenti
Com’è definita la varianza su variabili discrete?
la sommatoria dei quadrati delle differenze fra i valori e la media, moltiplicati per la probabilità di ciascun valore
Cos’è la PDF
Probability Density Function
Per variabili continue la probabilità di ciascun valore è nulla quindi prendo un intervallo all’interno di cui calcolo la probabilità e poi ne prendo la derivata (PDF)
Cos’è la CDF
Cumulated Distribution Function
p(x0)= p(x ≤ x0) <- Coda bassa
E’ l’integrale progressivo della PDF
Cos’è la correlazione? Che valori può assumere e perchè la si utilizza?
La correlazione fra x e y indica quanto le 2 variabili sono indipendenti fra loro.
E’ un numero compreso fra -1 e 1. -1 significa inversamente proporzionali, 0 significa non correlate e 1 significa direttamente proporzionali.
Quanti sono i gradi di libertà di un campione di n elementi?
n-1, perchè uno lo riesco a prevedere conoscendo la media e i restanti
Come calcolo la varianza?
La varianza è il valore atteso delle somme quadratiche diviso il numero di gradi di libertà
Cos’è una distribuzione?
La distribuzione è la “forma” di una popolazione (2 pop possono avere stesso valore atteso e varianza ma forme diverse)
Cos’è una distribuzione binomiale?
è una distribuzione discreta che si usa quando il risultato è successo o non successo e le prove fra loro indipendenti
(es: probabilità testa lanciando 10 volte moneta)
Cos’è la distribuzione di Poisson o degli eventi rari?
è una distribuzione discreta che valuta la probabilità di accadere di x eventi indipendenti (x>0) conoscendo la media
(utilizzata quando sono state effettuate tante prove e la probabilità evento è bassa)
es: probabilità fulmini nella prossima mezz’ora sapendo che mediamente ne cadono 200 all’anno
Cos’è la distribuzione geometrica?
è la distribuzione discreta che indica la probabilità di avere un successo dopo n insuccessi.
Dato p=costante (probabilità successo) all’aumentare di n prove effettuate con esito negativo
Cos’è la distribuzione uniforme?
è una distribuzione (discreta o continua) in cui tutti i valori hanno la stessa probabilità
Cos’è la distribuzione normale o gaussiana?
Distribuzione continua in cui la probabilità di ottenere un dato valore decresce asintoticamente fino a valori prossimi allo 0 (SENZA MAI RAGGIUNGERLO) allontanandosi dal valore atteso
Cos’è la distribuzione normale standard?
Una distribuzione normale avente valore atteso 0 e varianza 1
Cosa significa variabili aleatorie indipendenti e identicamente distribuite (IID)?
Variabili aleatorie indipendenti e con la stessa probabilità
Cosa afferma il teorema del limite centrale e perché è utile?
Il teorema del limite centrale afferma che la somma o la media di un sufficiente numero di IID è quello di una distribuzione normale.
Ogni misura è frutto di una serie di eventi di cui non conosciamo la distribuzione ma se effettuiamo sufficienti misure queste convergono in una normale
Se moltiplico 2 v.a. fra loro la loro distribuzione cambia?
Sì
Cos’è la distribuzione Chi-quadro?
Una distribuzione continua data dalla somma di k distribuzioni normali standard (k è il gdl della Chi-quadro)
Com’è definita una T di Student?
Sia x una distribuz. Chi-quadro e z una distribuz. norm. standard
Una T di student è data da z/sqrt(x/k)
Com’è definita una F di Snedecor?
Sia X^2 u una Chi-quadro di u distribuz. normali standard e X^2 v una Chi-quadro di v normali standard
Una F di Snedecor è data da
dal rapporto fra xu / u e xv / v dove xu e xv sono i valori assunti dalle rispettive Chi-quadro per quei valori di x
Cos’è la funzione quantile?
E’ l’inversa della CDF (definita fra 0 e 1, dalla probabilità mi dà in output il valore x0)
Cosa significa omoschedastico? E come lo verifico?
Che i 2 campioni hanno la stessa varianza, lo verifico con un test della varianza
Quando uso il test di Student e quando il test di Welch?
Il test di Welch lo eseguo quando i due campioni non sono omoschedastici
Com’è definita la potenza di un test? E come viene influenzata?
La potenza è la probabilità di rifiutare l’ipotesi nulla quando essa è falsa.
Diminuisce con la differenza delle medie.
Aumenta con la dimensione dei campioni.
Aumenta con alpha.