sem 2: Organiser, visualiser et décrire les données Flashcards

(46 cards)

1
Q

nomme les différentes échelles

A

nominale
ordinale
d’intervalle
de rapport (ratio)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
1
Q

décrit échelle nominale

A

classification selon catégories (categorical), sans rang (faible)
qualitatif
absence d’ordre
permet de comparer la taille des catégories

ex: secteur d’activités des entreprises, classement des fonds selon leur stratégie d’investissement

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

décrit échelle ordinale

A

-classification selon des catégories (categorical) hiérarchisées
-qualitatif
-présence d’ordre

ex: classement selon cote de crédit (A, B, C)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

décrit échelle d’intervalle

A

-permet de calculer les écarts entre les données et les comparer
-quantitatif
-unité de mesure arbitraire, mais constante
-permet additions et soustractions

ex: température, aversion au risque d’un individu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

décrit échelle de rapport/ratio

A

-permet de calculer le lien de proportionnalité entre 2 valeurs
-possède un zéro absolu; absence totale de la mesure
-quantitatif

ex: argent, rendement, échéance

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

décrit les données transversales (cross-sectional data)

A

observation de plusieurs variables individuelles captés à un point spécifique dans le temps

ex: données de plusieurs entreprise le 6 juin

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

décrit les séries temporelles (time series data)

A

observation d’une seule variation sur différentes périodes

ex: les rendement mensuels d’un indice boursier

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

décrit la distribution de fréquences

A

répartition des données en intervalles par ordre de grandeur

contient fréquence absolue

facilite l’analyse des données

peut etre utilisée avec tous types d’échelles de mesure

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

comment construire distribution de fréquences

A
  1. ordre croissant
  2. calculer amplitude (max - min)
  3. choisir le nombre d’intervalles (n)
  4. créer les intervalles (min + amplitude)
  5. construire tableau du plus petit au plus grand
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

décrit la fréquence relative

A

fréquence absolue divisé par nombre totale (%)

lien avec fonction de DENSITÉ de probabilité

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

décrit la fréquence relative cumulée

A

somme des fréquences relatives

lien avec fonction de PROBABILITÉ cumulative (0 à 1)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

décrit l’histogramme

A

diagramme en batons

x = intervalles
y = fréquence absolue

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

décrit la courbe de fréquences

A

segments se reliant par des points

x = point milieu de l’intervalle
y = fréquence absolue

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

décrit la courbe de fréquence relatives cumulées

A

permet de déterminer le nombre d’observations inférieur à une valeur donnée

x = valeur maximale de l’intervalle
y = fréquence absolue

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

avantage moyenne arithmétique

A

affecté par la taille et amplitude des données

facile à utiliser

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

désavantage moyenne arithmétique

A

influencé par valeurs extrêmes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

comment trouver la médiane

A

impair = n/2 + 1

pair = moyenne de n/2 et n/2 + 1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

avantages médiane

A

pas affectée par valeurs extrêmes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

désavantages médiane

A

se concentre uniquement sur la position relative des données triées

aucune info sur la taille ou l’amplitude

19
Q

avantages mode

A

peut etre utiliser avec échelles nominales donc qualitatives

20
Q

désavantages mode

A

pass applicable aux données continues donc peu utilisé en finance

21
Q

décrit la moyenne pondéré (weighted mean)

A

beaucoup utilisé en finance

poids positif = position longue
poids négatif = position courte
x = rendement de l’actif

22
Q

décrit la moyenne géométrique (geometric mean)

A

calcul de taux moyen de croissance d’une variable

ex: calcul du rendement dans le temps d’un actif

23
Q

comment trouver la moyenne géométrique

A

G = racine enième des X (x >= 0)

Rg = somme des produits de (1 + Rt)^1/T - 1

24
décrit la moyenne harmonique
type spécial de moyenne pondérée ou le poids est inversement proportionnel à sa grandeur (plus de poids est élevé, moins on va en avoir) application: "cost-averaging" qui implique un investissement constant sur les marchés financiers
25
comment trouver la moyenne harmonique
Xn = n/ somme des (1/X) pour X >= 0
26
met en ordre croissant les moyennes géométriques, arithmétique et harmonique
harmonique géométrique arithmétique s'applique si les données sont identiques
27
décrit et nomme les quantiles
valeur égale ou inférieur à une fraction des données médiane = 2 quartile = 4 quintile = 5 déciles = dix percentiles = cent
28
la dispersion mesure quoi
la variabilité autour de la tendance moyenne
29
décrit la dispersion absolue
qté de la variabilité sans comparaison à un point de référence ex: amplitude, écart absolu moyen, variance
30
décrit la dispersion relative
qté de la dispersion par rapport à un point de référence ex: risque actif, coefficient de variation
31
avantages amplitude
facile à calculer
31
désavantages amplitude
aucun info sur la forme ou la distribution affecté par valeur extrèmes
32
décrit l'écart absolue moyen et comment le trouver
moyenne des écart absolue par rapport à la moyenne (comme la variance)
33
avantage écart absolu moyen
donne image précise de la distribution p/r a amplitude
34
désavantages écart absolu moyen
plus difficile à manipuler mathématiquement (versus variance)
35
avantage variance
mesure la + utilisé
36
désavantages variance
absence d'unité donc difficile à interpréter et communiquer
37
décrit écart type
mesure la plus utilisé pour estimer le risque
38
décrit semi-variance
seus les risqueés liés aux écarts négatifs par rapport à la moyenne ou autre valeur cible
39
décrit coefficient de variation et comment le trouver
mesure relative de la dispersion des données qui permet de comparer portefeuilles entre eux écart type / moyenne plus le cv est élevé, plus l'écart type est élevé donc plus c'est risqué
40
décrit l'asymétrie (skewness) d'une distribution
on fait souvent l'hypothèse que les rendements sont distribués NORMALEMENT Cela facilite calcul, car distribution completement décrite par moyenne et écart-type les moments permettent de décrire la distribution selon autres: moment ordre 1: moyenne ordre 2: variance ordre 3: coeff d'asymétrie ordre 4: coeff d'aplatissement
41
décrit le coefficient d'asymétrie
coeff d'asymétrie négatif = normale vers la droite coeff d'asymétrie positif = normale vers la gauche (ce qu'on préfere car signifie une plus grande fréquence d'excellentes performances)
42
décrit le coefficient d'aplatissement (kurtosis)
Ke > 0 = leptokurtique, donc distribution pointue p/r a la normale Ke < 0 = platikurtique, donc aplatie p/r a la normale pour l'excess de kurtosis, il faut ajouter le terme "-3(n -1)^2 / (n - 2)(n - 3)"
43
l'analyse de la dépendance entre 2 variables se fait via:
nuage de points analyse de corrélation (coefficient de pearson)
44
le coefficient de corrélation de pearson est toujours entre quels valeurs ?
-1 et 1