Unita 4 Flashcards
(29 cards)
Cos’è la variabilità
L’attitudine di un carattere quantitativo a manifestarsi in modo differente nel collettivo
Perché é importante la variabilità
É importante perché é alla base della statistica, infatti se tutti i fenomeni fossero uguali non avrebbe senso studiare la statistica. Inoltre la media di posizione e analitica non sono sufficienti a sintetizzare le informazioni soprattutto quando occorre confrontarle tra loro
Misura dí centralità
Consento di valutare il grado di dispersione delle modalità e la bontà della sintesi della distribuzione attraverso misure di centralità
Quali sono gli indici che ci aiutano ad esprimere le variabilità?
Gli indici assoluti di variabilità: sono espressi nella stessa unità di misura con la quale si rileva la modalità de carattere
Gli indici relativi di variabilità: sono adimensionali ovvero numeri puri che non vengono espressi da unità di misura
Proprietà degli indici di variabilità
1) la variabilità é uguale a zero se è solo se il carattere assume lo stesso valore
2)se almeno due osservazioni xi e xj sono diversi la variazione sarà >0
3) l’indice é invariato rispetto a transazioni v(x1,x2…)=v(x1+c, x2+c…)
4) un carattere d é più variabile di un carattere y nello stesso collettivo se la variazione di X é maggiore della variazione di Y
Campo di variazione formula
Delta= x(N)-x(1) ovvero estremo superiore meno estremo inferiore e rappresenta l’ampiezza della distribuzione
Perché il campo di variazione può essere applicato a pochi casi?
Perché dipende solo da due osservazioni e non tiene conto delle altre. Essendo la differenza tra estremo superiore e inferiore e poso stabile perché é sensibile a valori anomali .
Presenta difficoltà di calcolo in presenza di classi aperte
Che cos’è una differenza interquartile
É una differenza in base alla posizione = IR=Q3-Q1
Quali sono le particolarità della differenza interquartile
É un indice più stabile, perché non si basa su variazioni esterne ma solo interne.
Potrebbe essere nulla senza che il carattere risulti degenerato, ovvero che non varia
Cos’è lo scarto
Lo scarto è la differenza tra (XI-c), c rappresenta la centralità. Lo scarto valuta, il livello di dispersione del collettivo.
Come calcoliamo il centro
Attraverso la media e la mediana
Scostamenti semplici
Bisogna avere una visione globale e lo facciamo sommato tutti gli scarti e si divide per il numero di unità statistiche.
La formula è
Per la media: sommatoria per i che va da uno a N di (xi-media ) tutto diviso N
Per la mediana: sommatoria per i che va da uno a N di(xi-me) tutto diviso N
Scostamenti quadratici
Sono gli scarti al quadrato, i risultati sono che i valori più distanti dal centro hanno un maggior peso mentre i valori più vicini hanno un minor peso. Inoltre, possiamo utilizzare la proprietà della media aritmetica, ovvero che minimizza la somma degli scarti al quadrato.
Cosa utilizziamo negli scostamenti quadratici
Si utilizza la varianza (sigma quadro)
Se i valori della distribuzione sono uguali allora la varianza é nulla. La varianza non ha un massimo, più si allontana dallo zero é più è variabile.
La formula è sigma quadro uguale alla sommatoria per i che va da uno a N di (xi-media ) al quadrato tutto diviso N
Proprietà della varianza
1) dipende da tutte le modalità del carattere
2) assume solo valori positivi, quindi la varianza è maggiore di zero
3) è nullo se il carattere è degenerato, ovvero non varia
4) e sensibili ai valori anomali, perché lo è la media aritmetica
5) è in variante per traslazioni del tipo Y =x+a varianza di Y è uguale varianza di X
Cos’è lo scarto quadratico medio o la deviazione standard?
Ci dice quando in media i valori della distribuzione si discostano dal valore rappresentativo dell’intera distribuzione, cioè la media.
La formula é: radice quadrata sommatoria che va da uno a K di (xi-media) al quadrato tutto diviso N. Questa è la radice quadrata della varianza.
Qual è il senso di elevare al quadrato tutti gli scostamenti se poi dobbiamo considerare la radice quadrata della varianza?
1) la prima deriva dalla proprietà della media aritmetica poiché la somma degli scarti della media è nullo quindi è necessario utilizzare i quadrati.
2) la seconda invece è data dal fatto che elevando al quadrato possiamo attuare l’importanza delle modalità più vicine al valore medio e contemporaneamente dare il giusto peso a quelle più lontane
Perché la deviazione presenta problemi di lettura e come vengono risolti?
La varianza presenta un problema di lettura in quanto non viene espresso nella stessa unità di misura dei valori della distribuzione e infatti per avviare a questo problema si utilizza la deviazione standard
Qual è la formula di scott e come viene usata?
È possibile utilizzare la deviazione standard e per determinare l’ampiezza e quindi il numero di intervalli di modalità di una distribuzione in classi.
Formula di scott: w (ampiezza) approssima 3,5 per la deviazione standard tutto diviso radice di N
Per cosa non possono essere usati la varianza e lo scarto quadratico medio
Non possono essere usati per confronti tra:
1) più collettivi sui quali si manifestano lo stesso fenomeno con diverse origini di grande grandezza.
2) più fenomeni espressi anche da diverse unità di misura
Come si può ovviare il problema dei confronti della varianza e dello scarto quadratico medio?
Si possono ovviare attraverso indici relativi che possono essere costituiti in due modi :
1) rapportando l’indice di variabilità assoluto ad una media
2) rapportando l’indice di variabilità assoluto al massimo valore che può assumere
Come si può ovviare il problema dei confronti della varianza e dello scarto quadratico medio?
Si possono ovviare attraverso indici relativi che possono essere costituiti in due modi :
1) rapportando l’indice di variabilità assoluto ad una media
2) rapportando l’indice di variabilità assoluto al massimo valore che può assumere
Cosa si utilizza per confrontare la variabilità di due distribuzione?
Possiamo utilizzare il coefficiente di variazione costituito come rapporto tra lo scarto quadratico medio è la media in valore assoluto.
Generalmente viene espresso in percentuale
Distribuzione simmetrica
Nella distribuzione simmetrica, moda media e mediana coincidono. Le frequenze sono simmetriche uguali da un lato e dall’altro si dice simmetrica se:
1) la distanza tra primo quartile e mediana e tra mediana terzo quartile é uguale.
2) la distanza tra X minimo è il primo quartile e tra il terzo quartile e X massimo è uguale
3) la mediana la media inter cortile è il Mid range coincidono