18. A Big Data ökoszisztémája (Apache Hadoop, Apache HDFS) Flashcards

1
Q

a. Mi a Big Data definíciója, ismertesse a 5V elméletet?

A

Big Data: olyan adathalmaz, melybe az adatok nagy mennyiségben, nagy sebességgel, és változatos módon érkeznek

3V:
Volume **(mennyiség): nagy mennyiségű struktúrálatlan adatot kezelünk
Velocity (sebesség): különböző sebességben érkeznek adatok
-
Batch
–> kupacok feldolgozása
-Realtime –> ahogy megjelenik az adat feldolgozásra kerül
-Stream –> ugyan az csak –> folyamatosan jönnek az adatok

5V esetén kiegészül
-Value (érték) –> adatoknak értéket kell képviselniük
-Veracity (megbízhatóság) –> adatoknak megbízhatónak kell lenniük

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
1
Q

b. Ismertesse az Apache Hadoop ökoszisztéma fő elemeit az ábra alapján!

A

Quizlet-es cucc!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

c. Mutassa be az Apache HDFS jellemzőit, használatát, előnyeit és hátrányait az ábra alapján!

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Namenode

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Datanode

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Block ops

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Kliens (olvasás, írás)

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Metadata

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly