Statistica descrittiva e inferenziale Flashcards

(30 cards)

1
Q

Cos’è una variabile stocastica?

A

Una variabile che assume valori casuali, non prevedibili neanche conoscendo i valori precedenti

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Com’è definita la varianza su variabili discrete?

A

la sommatoria dei quadrati delle differenze fra i valori e la media, moltiplicati per la probabilità di ciascun valore

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Cos’è la PDF

A

Probability Density Function
Per variabili continue la probabilità di ciascun valore è nulla quindi prendo un intervallo all’interno di cui calcolo la probabilità e poi ne prendo la derivata (PDF)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Cos’è la CDF

A

Cumulated Distribution Function
p(x0)= p(x ≤ x0) <- Coda bassa
E’ l’integrale progressivo della PDF

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Cos’è la correlazione? Che valori può assumere e perchè la si utilizza?

A

La correlazione fra x e y indica quanto le 2 variabili sono indipendenti fra loro.
E’ un numero compreso fra -1 e 1. -1 significa inversamente proporzionali, 0 significa non correlate e 1 significa direttamente proporzionali.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quanti sono i gradi di libertà di un campione di n elementi?

A

n-1, perchè uno lo riesco a prevedere conoscendo la media e i restanti

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Come calcolo la varianza?

A

La varianza è il valore atteso delle somme quadratiche diviso il numero di gradi di libertà

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Cos’è una distribuzione?

A

La distribuzione è la “forma” di una popolazione (2 pop possono avere stesso valore atteso e varianza ma forme diverse)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Cos’è una distribuzione binomiale?

A

è una distribuzione discreta che si usa quando il risultato è successo o non successo e le prove fra loro indipendenti
(es: probabilità testa lanciando 10 volte moneta)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Cos’è la distribuzione di Poisson o degli eventi rari?

A

è una distribuzione discreta che valuta la probabilità di accadere di x eventi indipendenti (x>0) conoscendo la media
(utilizzata quando sono state effettuate tante prove e la probabilità evento è bassa)
es: probabilità fulmini nella prossima mezz’ora sapendo che mediamente ne cadono 200 all’anno

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Cos’è la distribuzione geometrica?

A

è la distribuzione discreta che indica la probabilità di avere un successo dopo n insuccessi.
Dato p=costante (probabilità successo) all’aumentare di n prove effettuate con esito negativo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Cos’è la distribuzione uniforme?

A

è una distribuzione (discreta o continua) in cui tutti i valori hanno la stessa probabilità

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Cos’è la distribuzione normale o gaussiana?

A

Distribuzione continua in cui la probabilità di ottenere un dato valore decresce asintoticamente fino a valori prossimi allo 0 (SENZA MAI RAGGIUNGERLO) allontanandosi dal valore atteso

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Cos’è la distribuzione normale standard?

A

Una distribuzione normale avente valore atteso 0 e varianza 1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Cosa significa variabili aleatorie indipendenti e identicamente distribuite (IID)?

A

Variabili aleatorie indipendenti e con la stessa probabilità

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Cosa afferma il teorema del limite centrale e perché è utile?

A

Il teorema del limite centrale afferma che la somma o la media di un sufficiente numero di IID è quello di una distribuzione normale.
Ogni misura è frutto di una serie di eventi di cui non conosciamo la distribuzione ma se effettuiamo sufficienti misure queste convergono in una normale

17
Q

Se moltiplico 2 v.a. fra loro la loro distribuzione cambia?

18
Q

Cos’è la distribuzione Chi-quadro?

A

Una distribuzione continua data dalla somma di k distribuzioni normali standard (k è il gdl della Chi-quadro)

19
Q

Com’è definita una T di Student?

A

Sia x una distribuz. Chi-quadro e z una distribuz. norm. standard
Una T di student è data da z/sqrt(x/k)

20
Q

Com’è definita una F di Snedecor?

A

Sia X^2 u una Chi-quadro di u distribuz. normali standard e X^2 v una Chi-quadro di v normali standard
Una F di Snedecor è data da
dal rapporto fra xu / u e xv / v dove xu e xv sono i valori assunti dalle rispettive Chi-quadro per quei valori di x

21
Q

Cos’è la funzione quantile?

A

E’ l’inversa della CDF (definita fra 0 e 1, dalla probabilità mi dà in output il valore x0)

22
Q

Cosa significa omoschedastico? E come lo verifico?

A

Che i 2 campioni hanno la stessa varianza, lo verifico con un test della varianza

23
Q

Quando uso il test di Student e quando il test di Welch?

A

Il test di Welch lo eseguo quando i due campioni non sono omoschedastici

24
Q

Com’è definita la potenza di un test? E come viene influenzata?

A

La potenza è la probabilità di rifiutare l’ipotesi nulla quando essa è falsa.
Diminuisce con la differenza delle medie.
Aumenta con la dimensione dei campioni.
Aumenta con alpha.

25
Cosa sono le anomalie?
Degli errori con valori che si discostano troppo dalla media e dalla varianza del campione analizzato
26
Come verifico normalità?
Con il test del Chi-quadro o di Shapiro-Wilk (più potente, da affiancare a grafico quantile-quantile per vedere non siano anomalie)
27
Come verifico correlazione?
Con il test di Pearson, H1=i 2 campioni sono correlati
28
Cos'è un fattore e di che tipo può essere?
Un fattore è il risultato di un processo eseguito sul campione. Può essere quantitativo (esprimibile tramite numeri) o qualitativo. I livelli di un fattore sono detti trattamenti. Il valore misurato è detto resa
29
Come leggere test di Tukey?
Le coppie del trattamento in cui l'intervallo di confidenza interseca l'asse dello 0 non mostrano una differenza significativa
30