Data Science Flashcards

1
Q

Définir un bit

A

Plus petite unité de donnée dans un système d’information classique. Prend 2 états : I ou 0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Définir un byte

A

Un byte (ou octet) est un ensemble de 8 bits

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Citer les 3 fonctions (ou états) de l’information

A

Traitement, Stockage, Transport.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Définir la donnée structurée et donner des exemples

A

La donnée structurée est une donnée dont la structure porte de l’information : booléenne, entier, flotant,…

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Définir la donnée non-structurée

A

Une donnée sans structure, plus lourde, qui a besoin de contexte pour prendre son sens : tweet, image,…

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Définir une base de donnée

A

Une façon de stocker des données homogènes et de les relier entre elles

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qu’est-ce qu’une base de données relationnelle ?

A

Une BDD relationnelle se représente par des tableaux et stockent des données structurées

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qu’est-ce qu’une base de données non-relationnelles ?

A

Une collection de données non-structurées mais homogènes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quelle quantité de données a été créée jusqu’en 2020 ?

A

40 Zo dépassés en 2020

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

En combien d’années ont été crées 90% des données existantes ?

A

2 ans

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qu’est-ce que l’approche 3V de Russom ?

A

High Volume, High Velocity, High Variety

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

A quand remonte la naissance des statistiques descriptives ?

A

La préhistoire (2300 AEC)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qu’est-ce que le Web 2.0 ?

A

Web participatif, version évoluée du web vers plus d’interaction (2004)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qui a inventé le terme Big Data ?

A

Robert Mougalas

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

En quelle année Yahoo! lance Hadoop ?

A

2005

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Citer les 3 besoins d’analyses de big data

A
  1. L’analyse descriptive (what happened)
  2. L’analyse prédictive (what will happen)
  3. L’analyse prescriptive (how to make it happen)
17
Q

Définir un data warehouse

A

Un data warehouse est un ensemble de bases de données relationnelles conçu pour maximiser l’exactitude et l’accès à la donnée

18
Q

Comment est organisé un data warehouse ?

A

Sémantiquement, par sujet

19
Q

A quoi sert un ETL ?

A

Extraire, vérifier, transformer, harmoniser et charger la donnée
(Extract, Transform, Load)

20
Q

Qu’est-ce qu’un data mart ?

A

Un sous-ensemble (virtuel ou répliqué) du data warehouse qui organise la donnée par usage et alimente les outils de BI

21
Q

Quelle technique permet de stocker physiquement un volume de donnée croissant ?

A

Le scaling

22
Q

Quelles sont les 5 étapes du Data Science Process ?

A
  1. Ask a question
  2. Get the data
  3. Explore the data
  4. Model the data
  5. Communicate