0) Codici Rstudio Flashcards
inserire dati documento
dati<-read.csv(choose.files())
vedere i dati
- View(dati)–> apre un’altra scheda con la rappresentazione dei dati
- str(dati)–> mostra dati in consolle (più grezzo)
vedere tutti i dati di una variabile
dati$variabile (ex. genere)
–>Per vedere solo una parte–> dati$variabile[1:x] ex. dati$genere[1:40]
Trovare numero di righe/colonne (unità/variabili)
dim(dati)
Calcolare n. osservazioni per le singole modalità della variabile
tab=table(dati$variabile)
ex. tab=table(dati$genere)–> 107F, 34M (mostrato in environment, forma brutta di addmargins e senza somma totale; NECESSARIO usarlo prima di addmargins)
Calcolare, oltre alle singole modalità, la somma delle osservazioni relative ad una certa variabile
addmargins(tab)
–>ex. biondi18, neri11, rossi13, castani84, tot126 (mostrati in consolle)
Calcolare frequenza relativa delle varie modalità della variabile
prop.table(tab)
–>ex. biondi0.13, neri0.06, rossi0.08, castani0.75 (da trasformare in percentuali)
ordinare le modalità (ex. variabili cat. ordinali)
dati$variabile=factor(dati$variabile, levels=c(x1, x2, x3,x4), ordered=TRUE
calcolare frequenza assoluta cumulata
cumsum(table(dati$variabile)
creare grafico a barre per modalità di una variabile
barplot(table(dati$variabile)
creare istogramma per variabile
hist(dati$variabile)
…variabile, breaks=c(x1,x2,x3,x4…))
calcolare distribuzioni cumulate empiriche (min, max, mediana, quartili)
summary(dati$variabile)
calcolare percentili
quantile(dati$variabile, na.rm=TRUE)
variante:
quantile(dati$variabile, c(.1,.2,.3,…),na.rm=TRUE)
calcolare mediana
median(x)
calcolare scarto interquartile (interquartile range)
IQR(dati$variabile, na.rm=TRUE)