big data Flashcards

get a good grade or something (21 cards)

1
Q

Livelli di streaming

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Architetture streaming(architettura a livello generale, tipi di stream e tipi di formati a livello di messaggio, confronti, quali sono meglio a sec onda della situazione e perché)

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Spark architettura e workflow

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Data Platform (Data lake, datalakehouse, data fabric, data grid)

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Sliding window e data driven window

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

principio di data locality

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

formati dei dati in hadoop (row-oriented vs column oriented) in particolare perché la compressione dei dati è migliore con questi formati rispetto dei formati standard

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Evoluzione Architetture BD (SMP, MPP, Cluster)

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Architetture, scale out, scale up

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Definizione di big data e 4V

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

5 possibili cause di inconsistenza nei DB NoSql

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Algoritmi di streaming count-distinct

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

dbnosql, perché vengono usati? vantaggi/svantaggi

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Formati Hadoop/specifici big data. Deep in su formato parquet (domande di ragionamento tipo quando non vanno usati e perché)

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

HDFS

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Spark SQL che differenze ci sono con RDD + ottimizzazione query

17
Q

perché il blockpool non ha dimensioni infinite? hdfs nn e dn, meccanismi di backup

A

perché è locato in ram

18
Q

Tipi di window in streaming

19
Q

Cap e pacelc (anche qui domande di ragionamento/esempi)

20
Q

Catalyst e perché per le query SQL abbiamo un ottimizzatore mentre per le query su RDD non ne abbiamo

21
Q

Hdfs caratteristiche generali e architettura