Statistica Flashcards

(184 cards)

1
Q

Dimmi cos’è la statistica (scienza dello stato)

A

insieme dei principi e dei metodi per la raccolta, elaborazione, utilizzazione e interpretazione di informazioni riguardanti fenomeni collettivi.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Dimmi cosa sono le unità statistiche

A

le entità elementari a cui si riferiscono le informazioni di interesse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Dimmi cos’è una variabile

A

Una variabile è l’informazione di interesse di un’indagine

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Dimmi cosa fa la statistica descrittiva

A

Fornisce gli strumenti per rappresentare, sintetizzare ed interpretare il modo in cui un fenomeno di interesse si è manifestato nel collettivo osservato

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Dimmi cosa fa la statistica inferenziale

A

Ha l’obiettivo di generalizzare i risultati osservati sul campione all’intera popolazione (rappresentata dal campione). Per fare questo si basa sulla teoria della probabilità

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Dimmi cos’è la popolazione

A

La popolazione è l’insieme di tutte le unità che costituiscono il gruppo che si è interessati ad analizzare

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Dimmi cos’è il campione

A

Il campione è l’insieme delle unità statistiche omogenee rispetto a qualche circostanza di interesse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Dimmi come si dividono le variabili

A
  • categoriche/qualitative (nominali: sì/no e ordinali: presentano un grado o livello)
  • numeriche/quantitative (discrete: ottenute tramite conteggio e continue: hanno unità di misura)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Dimmi come si rappresentano le variabili categoriche

A
  • Distribuzione di frequenze
  • Diagramma a barre
  • Diagramma a torta
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Dimmi come si rappresentano le variabili numeriche

A
  • Distribuzione di frequenze
  • Istogramma
  • Ogiva
  • Box-plot
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Dimmi cos’è una distribuzione di frequenza

A

è una tabella contenente le categorie (o intervallo di valori) che si osservano nei dati e le corrispondenti frequenze con cui i dati appartengono alle categorie (o intervallo di valori)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Dimmi cos’è la frequenza assoluta (ni)

A

Il numero di volte in cui in una categoria di n unità statistiche è osservata la variabile di indagine

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Dimmi cos’è la frequenza relativa

A

Frequenza relativa(pi) = Frequenza assoluta (ni) / n. totale di osservazioni (n)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Dimmi 3 cose sui diagrammi a barre

A
  • Ciascuna barra è associata ad una categoria della variabile considerata
  • Tutte le barre hanno la stessa larghezza
  • L’altezza delle barre è proporzionale alle frequenze
    delle categorie
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Dimmi 2 cose sui diagrammi a torta

A
  • La torta è divisa in tante fette quante sono le categorie della variabile categorica considerata
  • L’ampiezza di ciascuna fetta è proporzionale alla frequenza della categoria corrispondente
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Dimmi cosa sono le classi e quando sono necessarie

A

intervalli disgiunti e che coprono l’intero intervallo di valori. Per le variabili numeriche le osservazioni possono assumere molti valori diversi tra loro. In questi casi si suddivide l’insieme dei valori che la variabile può assumere in intervalli, detti classi

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Dimmi come si determina l’ampiezza di ciascuna classe

A

Ampiezza dell’intervallo = valore massimo−valore minimo / numero di classi

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Dimmi com’è la notazione degli intervalli per i valori numerici

A

a ⊣ b indica tutti i valori da a (escluso) a b (incluso),
a ⊢ b indica tutti i valori da a (incluso) a b (escluso),
a ⊢⊣ b indica tutti i valori da a (incluso) a b (incluso).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Dimmi 3 cose sull’istogramma

A
  • Un grafico dei dati contenuti in una distribuzione di frequenze per dati numerici suddivisi in classi è chiamato istogramma
  • Gli estremi degli intervalli sono rappresentati sull’asse orizzontale.
  • L’asse verticale rappresenta la frequenza delle classi. L’altezza delle barre rappresentare il numero di osservazioni in ciascuna classe (o la frequenza relativa di ciascuna classe).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Dimmi cos’è la frequenza relativa cumulativa

A

La frequenza cumulativa per ogni classe, è la frequenza relativa fino alla classe considerata inclusa

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Dimmi cos’è un’Ogiva

A

Linea che rappresenta le frequenze cumulative. Graficamente si presenta come una spezzata che unisce i punti che hanno per ascisse gli estremi degli intervalli e per ordinate le corrispondenti frequenze relative cumulative

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Dimmi quando la forma della distribuzione è simmetrica o asimmetrica

A

La forma della distribuzione si dice simmetrica se le osservazioni sono bilanciate, o distribuite in modo approssimativamente regolare attorno al centro.

La forma della distribuzione è detta asimmetrica se le osservazioni non sono distribuite in modo simmetrico rispetto al centro. (Con coda a sx o a dx)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Dimmi quali sono gli obiettivi per una presentazione efficace dei dati

A

• Presentare i dati in modo da mostrare le informazioni essenziali.
•Comunicare idee complesse chiaramente ed in modo accurato.
• Evitare distorsioni che possono comunicare il messaggio sbagliato.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Dimmi quali sono degli errori nella presentazione dei dati

A

•Diversa ampiezza delle classi di intervallo in un istogramma che rappresenta le frequenze/freq. relative
• Compressione o distorsione dell’asse verticale
• Omissione dello zero sull’asse verticale
• Non fornire una base di riferimento per il confronto di
dati di diversi gruppi.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Dimmi come si descrivono numericamente i dati (2)
- tendenza centrale - variabilità
26
Dimmi quali sono le misure di tendenza centrale (centralità)/ indici di posizione (3)
- media - mediana - moda
27
Dimmi 4 cose sulla media
- è la misura di tendenza centrale più comune - somma dei valori diviso il numero di valori - Può essere calcolata solo per variabili quantitative - è influenzata dai valori estremi (outlier)
28
Dimmi qual è la prima proprietà della media
- la somma degli scarti delle osservazioni (i valori xi) dalla relativa media è uguale a zero
29
Dimmi qual è la seconda proprietà della media
- la media è un operatore lineare
30
Dimmi 5 cose sulla mediana
- In una lista di numeri ordinati in ordine crescente, la mediana è il valore “centrale” (50% prima, 50% dopo) - Non influenzata da valori estremi - posizione centrale = (n+1)/2 - Se n è dispari, la mediana è l’osservazione al centro della lista ordinata - Se n è pari la mediana è la media delle due osservazioni che hanno la posizione attorno a quella centrale. N.B. (n+1)/2 non è il valore della mediana, ma la posizione della mediana nella sequenza ordinata.
31
Dimmi 3 cose sulla moda
- Valore che ricorre più frequentemente - non influenzata da valori estremi - può non esserci una moda (quando tutti i valori hanno la stessa frequenza) - ci può essere più di una moda (quando più di un valore ha la frequenza massima) (distribuzione plurimodale)
32
Dimmi come individuare asimmetrie nella forma di distribuzione
- se mediana < media si ha un’asimmetria con coda a destra - Se si osserva che mediana > media la distribuzione è asimmetrica con coda a sinistra
33
Dimmi quali sono le misure di variabilità (5)
- campo di variazione - differenza interquartile - varianza - deviazione standard - coefficiente di variazione
34
Dimmi cosa fanno le misure di variabilità
Misurano grado con cui le variabili si dispongono intorno a un indice di centralità. Forniscono informazioni sulla dispersione o variabilità dei valori
35
Dimmi 2 cose sul campo di variazione
- Il campo di variazione (o Range) è la più semplice misura di variabilità - È la differenza tra il massimo e il minimo dei valori osservati
36
Dimmi quali sono gli svantaggi del campo di variazione
- Ignora il modo in cui i dati sono distribuiti - Sensibile agli outlier
37
Dimmi cosa sono i quartili
I quartili dividono la sequenza ordinata dei dati in 4 segmenti contenenti lo stesso numero di valori
38
Dimmi 1 cosa per ogni quartile
• Il primo quartile, Q1, è il valore per il quale 25% delle osservazioni sono minori e 75% sono maggiori di esso. • Q2 coincide con la mediana (50% sono minori, 50% sono maggiori). • Solo 25% delle osservazioni sono maggiori del terzo quartile, Q3
39
Dimmi come si calcolano i quartili
Un quartile si trova determinando il valore della sua posizione nella sequenza ordinata dei dati, dove Posizione primo quartile (Q1) = n+1/4 = 0.25(n+1) Posizione secondo quartile (Q2) = 2(n+1)/4= 0.50(n+1) (la posizione della mediana) Posizione terzo quartile (Q3) = 3(n+1)/4= 0.75(n+1) dove n è il numero di valori osservati
40
Dimmi 4 cose sul boxplot
- Il boxplot visualizza minimo, massimo e quartili di una variabile numerica - È costruito in maniera tale che la scatola (che si estende da Q1 a Q3) contenga il 50% delle osservazioni - La mediana è rappresentata da una linea che attraversa la scatola centrale. - Le linee che si estendono a partire dalla scatola sono chiamate baffi e vanno fino al massimo e fino al minimo.
41
Dimmi 4 cose sulla differenza interquartile
- Diversamente dal campo di variazione, la differenza interquartile non risente della presenza di outlier • Considera solo l’intervallo che contiene il 50% dei dati centrali e rappresenta l’ampiezza di questo intervallo. • Differenza Interquartile (IQR) = 3° quartile – 1° quartile IQR=Q3 –Q1 - Si può valutare la % di IQR rispetto al campo di variazione: IQR/Range (%). Più IQR/Range (%) si avvicina ad 1 maggiore è la dispersione.
42
Dimmi cos’è la varianza
- Si basa sulla differenze tra ciascuna osservazione e la loro media (scarto) - VARIANZA = media degli scarti al quadrato
43
Dimmi la formula ridotta della varianza
44
Dimmi quali sono le proprietà della varianza
- la varianza di una costante è pari a zero - la varianza è un operatore quadratico
45
Dimmi 3 cose sulla deviazione standard
- Misura di variabilità comunemente usata - Mostra la variabilità rispetto alla media - Ha la stessa unità di misura dei dati originali
46
Dimmi 2 cose sulla deviazione standard (pt 2)
- sensibile agli outlier
47
Dimmi 3 cose sul coefficiente di variazione
- Misura la variabilità relativa rispetto alla media - È espresso in percentuale (%) - Può essere usato per confrontare due o più variabili misurate con unità di misura diversa o con un diverso ordine di grandezza delle misurazioni
48
Dimmi cos’è lo Z-score o valore standardizzato e come si trova
- è il numero di deviazioni standard di cui un dato valore x è sopra o sotto la media - si trova traducendo un dato in una scala standardizzata
49
Dimmi quali sono media e varianza dello Z-score
- M= 0 - s^2= 1
50
Dimmi a cosa serve l’analisi bivariata
- L’analisi bivariata ci consente di valutare se esiste una relazione tra due variabili. In particolare, le due variabili sono indipendenti oppure dipendenti? - Vogliamo sapere se la distribuzione di una delle due variabili (Y) varia in base ai diversi valori dell’altra variabile (X).
51
Dimmi perché dipende da non vuol dire causalità
l’esistenza di un’associazione tra X e Y non significa dimostrare che tra X e Y c’è un rapporto di causa-effetto ... ... potrebbe esserci anche una variabile Z (latente o non nota) da cui dipendono sia X che Y che mette in relazione le due variabili
52
Dimmi come si valuta relazione tra due variabili quantitative (4)
- diagramma a dispersione - covarianza - coefficiente di correlazione lineare di Pearson - regressione lineare e R^2
53
Dimmi cosa si intende con il termine correlazione
Ciò che analizza se esiste una relazione tra due variabili (come e quanto due variabili variano insieme, studio della co-variazione) - relazione simmetrica
54
Dimmi cosa si intende con il termine regressione
Ciò che analizza la forma della relazione tra variabili, assumendo il ruolo delle variabili (i valori di una variabile dipendono dai valori dell’altra variabile) - relazione asimmetrica
55
Dimmi 3 cose sul diagramma a dispersione o scatterplot
- fornisce una rappresentazione grafica dell’andamento congiunto delle due variabili quantitative - Gli assi cartesiani del diagramma a dispersione rappresentano i valori delle due variabili (una ascissa, una ordinata) - L’insieme dei punti nel diagramma a dispersione si chiama nuvola di punti
56
Dimmi 3 cose sul diagramma a dispersione (pt 2)
• Se le due variabili sono statisticamente indipendenti, i punti si presentano sparpagliati sul diagramma, senza alcuna struttura • Se tra le due variabili c’è una relazione statistica, la nuvola di punti si presenta strutturata. Questa struttura ci dà informazioni sul tipo di relazione esistente • Osservando la nuvola di punti possiamo dedurre informazioni sulla forma, sulla forza e sulla direzione della relazione fra due variabili quantitative
57
Dimmi 2 cose sulla sommatoria
- il simbolo di sommatoria viene utilizzato per indicare in maniera compatta la somma di più elementi - il parametro i è un intero e rappresenta l’indice della sommatoria
58
Dimmi la prima proprietà della sommatoria
- Se tutti i termini della sommatoria hanno lo stesso valore c che non dipende dall’indice (ossia x1 = c, x2 = c, . . .), allora
59
Dimmi la seconda proprietà della sommatoria
- la sommatoria può essere scomposta
60
Dimmi la terza proprietà della sommatoria
- la sommatoria è un operatore lineare
61
Dimmi quali sono gli indici di dispersione (2)
- varianza - deviazione standard
62
Dimmi 3 cose sulla covarianza
- indica come varia X al variare di Y - misura il segno della relazione lineare tra 2 variabili (se diretta o inversa) - misura come le 2 variabili si discostano dai loro valori medi
63
Dimmi quali sono i 3 scenari in base al valore della covarianza
- positiva: al crescere di X, Y cresce (direttamente correlate) - negativa: al crescere di X, Y decresce (inversamente correlate) - uguale a 0: X e Y non sono linearmente correlate
64
Dimmi 4 cose sul coefficiente di Pearson
- si calcola sulla base dei valori della covarianza - fornisce indicazione se relazione lineare è diretta o inversa tra 2 variabili e quanto è forte la relazione - non ha unità di misura - varia tra -1 e 1
65
Dimmi i 3 scenari in base al valore del coefficiente di Pearson
- positivo: al crescere di X, cresce anche Y. Quanto più è vicino a 1 tanto è più forte la relazione lineare - negativo: al crescere di X, Y decresce. Quanto è più vicino a -1, tanto è più forte la relazione lineare negativa = uguale a 0: X e Y non sono linearmente correlate
66
Dimmi se il coefficiente di Pearson è influenzato dagli outliers
Si fortemente
67
Dimmi qual è l’obiettivo dell’analisi di regressione
Esprimere la relazione tra due o più variabili in forma matematica (equazione) Y= f(X) Y= variabile di risposta / dipendente X= variabile esplicativa / indipendente
68
Dimmi qual è lo scopo della statistica
La conoscenza quantitativa dei fenomeni collettivi
69
Dimmi cosa è necessario per estendere un indagine campionaria a tutta la popolazione
Un campione casuale
70
Dimmi cosa si intende per campionamento stratificato
Campionamento su popolazione di riferimento su cui si possiedono già alcune informazioni a priori
71
Dimmi il modo principale per acquisizione dati
Intervista
72
Dimmi quali sono i principali obiettivi di un’analisi statistica (2)
- sintetizzare dati - minimizzare perdita di informazione
73
Dimmi tra cosa sono compresi i valori della frequenza assoluta
Tra 0 e il numero totale di osservazioni
74
Dimmi tra cosa sono compresi i valori della frequenza relativa è la frequenza relativa cumulativa
Tra 0 e 1
75
Dimmi a cosa è uguale la somma delle frequenze assolute
Al numero di osservazioni
76
Dimmi a cosa è uguale la somma delle frequenze relative
A 1
77
Dimmi se le classi devono per forza avere la stessa ampiezza
No
78
Dimmi quando i dati sono grezzi e quando raggruppati
Grezzi appena raccolti, raggruppati quando sono nelle tavole di frequenza
79
Dimmi quali sono i grafici di distribuzioni di frequenza
Istogrammi e diagrammi a barre
80
Dimmi quale grafico viene utilizzato per distribuzione di frequenza di variabili discrete
Diagramma a barre: - rappresentazione quantitativa (ascisse: valore variabili, ordinata: frequenza assoluta) - rappresentazione qualitativa (diagramma a barre di Pareto) (ascisse: valore variabili in ordine decrescente di frequenza)
81
Dimmi quale grafico viene utilizzato per distribuzione di frequenza di variabili continue
Istogramma: rettangoli adiacenti, altezza indica frequenza, la larghezza indica la classe (dipende dal numero di classi e dalla loro ampiezza)
82
Dimmi quale grafico si usa per la distribuzione di frequenze di variabili qualitative
Diagramma a barre: basi delle barre sono tutte uguali (perché non ho bisogno di rappresentare ampiezza classi), altezza indica frequenza
83
Dimmi quali osservazioni descrivono un istogramma
- simmetria - centralità - concentrazione - anomalie
84
Dimmi quando la mediana è preferibile alla media
Quando si vogliono eliminare gli effetti di valori estremi
85
Dimmi cosa sono varianza e deviazione standard
Indici di dispersione
86
Dimmi in quali casi si usa coefficiente di variazione (2)
- quando misurazione variabile è basata su diverse unità di misura - quando c’è diverso ordine di grandezza delle misurazioni
87
Dimmi come sono rappresentati outliers nel boxplot
Con asterischi
88
Dimmi quando conviene usare boxplot
Per confrontare popolazioni simili
89
Dimmi cosa si intende per analisi bivariata
Osservazione congiunta di due variabili
90
Dimmi come si chiama l’analisi di due variabili congiunte qualitative
Analisi di associazione
91
Dimmi come si chiama l’analisi di due variabili congiunte quantitative
Analisi di correlazione e regressione
92
Dimmi cos’è una retta di regressione
Retta che si disegna quando c’è relazione lineare tra le variabili
93
Dimmi cos’è il coefficiente di correlazione delle variabili X e Y
94
Dimmi cos’è il coefficiente di correlazione delle variabili X e Y
95
Dimmi se la covarianza è il coefficiente di correlazione hanno lo stesso segno
Si
96
Dimmi quali sono i 3 scenari possibili in base al valore della covarianza
- se >0 sono direttamente correlate - se <0 sono inversamente correlate - se =0 non sono correlate
97
Dimmi cos’è il coefficiente di correlazione
Un indice normalizzato che quando vale -1 o +1 indica che la correlazione tra le variabili X e Y è massima o perfetta e che le osservazioni Yi sono funzioni lineari delle Xi
98
Dimmi qual è l’obiettivo dello studio della regressione
Sintetizzare l’informazione della variabilità dello scatterplot scegliendo la retta che minimizzi la perdita di informazioni
99
Dimmi cos’è il metodo dei minimi quadrati
Il metodo con cui si trova una retta che minimizzi al massimo la perdita di informazioni, passando approssimativamente vicino a tutti i punti XiYi
100
Dimmi qual’è l’espressione per trovare la somma dei quadrati delle distanze tra il punto XiYi e il punto di uguale ascissa che si trova sulla retta y= ax + b
101
Dimmi quali sono i 2 obiettivi dell’analisi di regressione
- Esprimere la relazione tra due o più variabili in forma matematica (un’equazione) - prevedere il valore della variabile Y conoscendo il valore della variabile X
102
Dimmi com’è un’equazione di regressione
Y= f(X) Y è la variabile di risposta/ dipendente (outcome) ed è espressa come funzione di una variabile esplicativa/ indipendente (X)
103
Dimmi 2 cose sulla regressione lineare
- la relazione tra variabili è rappresentata da una linea retta - equazione: Y= aX + b a= coefficiente angolare, rappresenta pendenza retta b= intercetta
104
Dimmi cos’è il residuo o errore
La differenza tra il valore predetto (y^i) dalla retta di regressione in base al valore di Xi e il valore di Y osservato in corrispondenza del valore di Xi
105
Dimmi come si calcola la pendenza della retta della regressione lineare
106
Dimmi 2 cose sull’intercetta della retta di regressione lineare
- stima il valore medio atteso di Y quando X=0 - la retta passa sempre per il punto di incontro delle medie delle due variabili
107
Dimmi 3 cose sul coefficiente di regressione “a”
- a>0 se aumenta X, aumenta anche Y - a<0 se aumenta X, Y diminuisce - indica il cambiamento medio di Y in base al valore X, non è una relazione esatta
108
Dimmi quando usare retta di regressione
Quando si vuole prevedere un valore di Y dato un valore di X (ex: prevedere il peso di un soggetto alto 168 cm)
109
Dimmi quando è meglio non usare retta di regressione
Quando si vuole prevedere valori di Y in corrispondenza di valori di X molto al di fuori dell’intervallo delle osservazioni
110
Dimmi cos’è l’indice di determinazione della bontà di adattamento lineare
Un indice che misura la quota di informazione trattenuta dalla retta di regressione in percentuale dell’informazione sulla variabilità totale
111
Dimmi a cosa corrisponde la deviazione non spiegata della regressione
All’errore o residuo Yi - Y^i
112
Dimmi a cosa corrisponde deviazione totale
113
Dimmi come trovare deviazione spiegata dalla regressione
114
Dimmi 3 cose sull’indice di adattamento R^2
misura quanta parte della variabilità totale di Y il modello di regressione riesce a spiegare
115
Dimmi cosa vuol dire se R^2 tende a 1
Indica che la quota di variabilità spiegata dalla retta si avvicina molto alla variabilità totale, quindi siamo in presenza di ottima bontà di adattamento lineare
116
Dimmi cosa vuol dire se R^2 tende a 0
Indica che la retta spiega una quota infinitesimale della variabilità totale che nella scomposizione precedente sarà contenuta tutta nella quantità residuale SSE
117
Dimmi qual è il rapporto tra indice di adattamento R^2 e coefficiente di correlazione
118
Dimmi quali tipi di analisi si fanno se X e Y sono quantitative (2)
- analisi di correlazione - analisi di regressione
119
Dimmi quale tipo di analisi di fa se X e Y sono qualitative
Analisi di associazione
120
Dimmi quali tipi di associazione esistono (3)
- CAUSALE: esposizione causa malattia - SPURIA: esposizione non causa malattia - NON CAUSALE: - malattia causa l’espozione - terzo fattore
121
Dimmi cos’è una tabella di contingenza
Metodo usato per verificare associazioni tra variabili qualitative ma anche quantitative
122
Dimmi cosa sono riportate nelle tabelle di contingenza
Frequenze assolute congiunte (nij)
123
Dimmi cosa sono le frequenze assolute marginali nelle tabelle di contingenza
Somma delle frequenze di una riga (frequenza assoluta marginale per riga) o di una colonna (frequenza assoluta marginale per colonna)
124
Dimmi se esistono anche le frequenze relative e relative marginali nelle tabelle di contingenza
Si esistono
125
Dimmi cos’è la frequenza relativa condizionata di colonna o di riga (stessa roba per la condizionata assoluta)
La frequenza relativa di una caratteristica nella riga sul totale della colonna di quella caratteristica
126
Dimmi quando 2 variabili si dicono statisticamente indipendenti
- se le frequenze relative condizionate sono uguali alle frequenze relative marginali
127
Dimmi formula frequenza assoluta congiunta attesa
128
Dimmi formula frequenza relativa congiunta attesa
129
Dimmi cosa si trova quando le 2 variabili sono dipendenti nelle tabelle di contingenza
130
Dimmi da cosa è dato lo scostamento tra le frequenze assolute congiunte osservate e quelle attese
131
Dimmi cos’è l’indice chi-quadrato
- indice usato per valutare associazione di 2 variabili
132
Dimmi un’altra formula dell’indice chi-quadrato
133
Dimmi cos’è la sensibilità di un test
Probabilità che una persona malata riceva un risultato positivo al test
134
Dimmi cos’è la specificità di un test
Probabilità che una persona che non ha la malattia riceva un test negativo
135
Dimmi 2 cose sulla specificità e sensibilità nell’interpretazione dell’accuratezza
- più la sensibilità è vicina a 1 più il test è accurato a identificare individui malati - più la specificità è vicina a 1 più il test è accurato a identificare individui sani
136
Dimmi cos’è il valore predittivo positivo
Probabilità che una persona positiva al test abbia la malattia
137
Dimmi cos’è il valore predittivo negativo
Probabilità che una persona negativa al test sia effettivamente sana
138
Dimmi quanto deve essere la prevalenza perché sia effettivo e rappresentativo della popolazione
Vicino a 50%
139
Dimmi la definizione di probabilità
Rapporto tra numero di casi favorevoli affinché un evento si verifichi è il numero di casi possibili
140
Dimmi cosa sono eventi equiprobabili
Eventi che hanno la stessa probabilità di verificarsi individualmente
141
Dimmi cosa si intende per spazio degli eventi o spazio campionario
Insieme di tutti i risultati possibili di un evento aleatorio (si indica con E)
142
Dimmi cos’è un evento
Ogni possibile sottoinsieme dello spazio campionario
143
Dimmi quando due eventi si dicono incompatibili o disgiunti
Quando non possono verificarsi contemporaneamente
144
Dimmi quando due eventi si dicono compatibili
Quando possono verificarsi contemporaneamente
145
Dimmi come calcolare la probabilità di eventi compatibili
146
Dimmi cos’è il prodotto logico di eventi
È l’evento che si verifica se si verificano contemporaneamente sia l’evento E1 che l’evento E2 e si indica
147
Dimmi quando due eventi sono indipendenti
Quando il verificarsi di uno non influenza l’altro
148
Dimmi quando due eventi si dicono dipendenti o correlati
Quando il verificarsi di un evento influenza il secondo evento modificandone la probabilità (ex: estrazione con o senza reimbussolamento)
149
Dimmi la formula della probabilità condizionata
La probabilità condizionata riduce lo spazio degli eventi
150
Dimmi cosa fa il teorema di Bayes
Permette di quantificare la probabilità che un dato evento abbia alla sua origine una determinata causa
151
Dimmi quali sono i 3 step della conduzione di uno studio epidemiologico
- definizione degli obiettivi della ricerca - analisi delle condizioni - scelta del tipo di disegno dello studio
152
Dimmi quali sono esempi di studi sperimentali in uno studio epidemiologico
- prova randomizzata controllata - prova con intervento
153
Dimmi quali sono esempi di studi osservazionali analitici in uno studio epidemiologico
- studi trasversali - studi di coorte - studi di caso-controllo
154
Dimmi un esempio di studio osservazionale di correlazione in uno studio epidemiologico
Ecologico
155
Dimmi cos’è uno studio sperimentale
Un’indagine che permette di confrontare 2 o più gruppi di individui riguardo all’esito di trattamenti diversi
156
Dimmi cosa si intende per trattamento in uno studio sperimentale
Qualunque intervento di tipo terapeutico, profilattico o altro, volto a modificare lo stato di salute dell’uomo
157
Dimmi per cosa sono anche usati gli studi sperimentali
Per valutare l’efficacia di procedure diagnostiche, test di laboratorio, ecc…
158
Dimmi in cosa consiste uno studio sperimentale
In un set di osservazioni condotto sotto circostanze controllate in cui lo sperimentatore manipola le condizioni per indagare gli effetti che tali manipolazioni hanno sugli elementi in studio
159
Dimmi cosa è importante perché uno studio sia valido
È importante che l’unico fattore che varia tra i gruppi sotto osservazione sia quello in studio. Ciò è garantito dalla randomizzazione
160
Dimmi la differenza tra clinical trial e field trial VS community trial
Clinical e field trial riguardano singoli soggetti, i community riguardano gruppi
161
Dimmi cosa riguardano i clinical trial
I soggetti che hanno una patologia
162
Dimmi cosa riguardano i field e community trial
La prevenzione primaria
163
Dimmi quali sono le procedure per rimuovere le possibili fonti di bias negli studi sperimentali
Il blinding (single, double, triple)
164
Dimmi cosa sono gli studi osservazionali
Fotografano in un dato tempo le dimensioni di parametri definiti in un gruppo di soggetti selezionati in funzione di ampi criteri di inclusione. Permette di ottenere informazioni più aderenti perché avviene in condizioni normali
165
Dimmi 3 limiti degli studi osservazionali
- validità statistica è ridotta dal limitato rigore e dall’alto numero di variabili ma aumentata dall’alto numero di soggetti - completano gli studi sperimentali con i loro lunghi periodi di osservazione
166
Dimmi cosa sono gli studi di correlazione
Studi che mettono in relazione la distribuzione di uno o più fattori di rischio e una patologia. È possibile verificare le relazioni solo di un gruppo
167
Dimmi quali sono i vantaggi di uno studio caso-controllo (6)
- adatti a studi di malattie rare o a lunga latenza - veloci da condurre - poche risorse economiche - pochi soggetti - possono essere usati dati già esistenti - si possono studiare cause potenziali di malattia
168
Dimmi quali sono gli svantaggi di uno studio caso-controllo
- si affidano a dati già rilevati in passato o al ricordo - validazione delle info è quasi impossibile - selezione di un gruppo appropriato è difficile - non si può stabilire sequenza eventi
169
Dimmi 2 cose sugli studi di coorte
- Il gruppo di persone da studiare (coorte) sono selezionate in funzione delle caratteristiche presenti prima della comparsa della malattia - la coorte viene osservata per un periodo di tempo per determinare e confrontare frequenza malattia in studio
170
Dimmi quali sono i vantaggi degli studi di coorte (5)
- adatti per lo studio di esposizioni comuni, malattie multifattoriali - si possono valutare effetti multipli di singole esposizioni - si può dimostrare relazione temporale tra esposizione e malattia - permette di misurare direttamente incidenza della malattia negli esposti e non esposti nella popolazione
171
Dimmi cos’è la funzione cumulativa
La probabilità che X assuma un valore minore di un generico valore Xo
172
Dimmi come si calcola valore atteso di una variabile casuale discreta
173
Dimmi come si calcola varianza variabile aleatoria discreta
174
Dimmi come si calcola deviazione standard o scarto quadratico medio di una variabile discreta
175
Dimmi come trovare media e varianza del,a variabile X + Y (indipendenti)
176
Dimmi quali sono distribuzioni di probabilità discrete
- binomiale - Poisson
177
Dimmi 3 cose sulla distribuzione di Bernoulli (caso particolare di binomiale)
- 2 esiti: successo (S) o insuccesso (INS) - S= p INS= 1-p - variabile aleatoria di Bernoulli X= 1 (successo), X=0 (insuccesso)
178
Dimmi quali sono media e varianza della distribuzione di Bernoulli
179
Dimmi cos’è variabile aleatoria binomiale
Numero di successi in n numero di prove ripetute
180
Dimmi 3 caratteristiche della sequenza di n prove ripetute nella distribuzione binomiale
- ogni prova può essere S o INS, oppure 1 o 0 - probabilità S e INS è la stessa - prove sono indipendenti
181
Dimmi coeff. binomiale per trovare il numero di sequenze con X successi in n prove
182
Dimmi formula distribuzione di probabilità binomiale (probabilità di X successi in n prove)
183
Dimmi quando si ha una diagnosi diretta
Quando si ha una dimostrazione del patogeno direttamente nel campione
184
Dimmi quando si ha diagnosi indiretta
Quando sintomi paziente rivelano presenza patogeno (ex: produzione anticorpi)