Niveau, dispersion, profile Flashcards
(44 cards)
Quels sont les 3 composantes d’un jeu de données?
Niveau, dispersion, profile.
Dans le cadre des statistiques, qu’est-ce qui résume une distribution?
Que faut-il lui associer pour que ce «résumé» veuille dire quelque chose?
La moyenne.
Associer: variance/écart-type.
Que peut-on calculer à partir d’un jeu de données (calculs de base)?
Moyenne
Covariance
Variance
Ecart-type
À quoi sert l’écart-type et comment fonctionne-t-il?
Utilité: vérifier la représentativité de la moyenne.
Fonctionnement: plus l’écart-type est petit, plus la moyenne est représentative.
Dans le cadre des statistiques, qu’est-ce que le niveau?
La moyenne.
Dans le cadre des statistiques, qu’est-ce que la dispersion?
Variance/écart-type.
Dans le cadre des statistiques, qu’est-ce que le profile?
Silhouette (la forme graphique des données).
À quel composante d’un jeu de données le test T et dérivés (ANOVA, MANOVA, etc.) sont-ils sensibles?
Au niveau (moyenne).
À quel composante d’un jeu de données l’analyse factorielle (AF) est-elle sensible?
Au profile (silhouette) (corrélation???).
Quel calcul fait-on lorsque nous centrons des données?
Quelle en est la conséquence mathématique?
Données brutes moins moyenne.
Moyenne = 0.
Quel(s) calcul(s) fait-on lorsque nous standardisons des données?
Quels sont les moyennes et écart-type de données standardisées?
En général comment appelle-t-on cette standardisation?
Calculs de la standardisation:
- Données brutes moins moyenne (= données centrées);
- données centrées divisées par écart-type (= données standardisées).
μ = 0, σ = 1
Appelée score Z.
Quelle est la formule simplifiée de l’écart-type?
s = sqrt((n∑(x^2)-(∑x)^2))/(n(n-1)))
Quel calcul doit-on faire pour trouver la variabilité partagée (variance expliquée) d’une corrélation?
Il faut mettre le coefficient de corrélation au carré (p.ex: r = 0.84; r^2 = 0.71, donc la corrélation explique 71% de la variance).
Qu’est-ce que l’effet de «restriction de gamme»?
Lorsqu’il y a peu d’observation il y a un risque de «restriction de gamme», c’est-à-dire qu’on ne trouve pas de corrélation à cause d’un n (échantillon) trop petit.
Dans la «Classification des principales techniques d’analyse des données», quelles sont les types de populations que l’on peut avoir?
Homogène et hétérogène.
Dans la «Classification des principales techniques d’analyse des données», quelles sont les types de solutions que l’on peut avoir?
Dimensionnelle et non-dimensionnelle.
Dans la «Classification des principales techniques d’analyse des données», quel est le type d’information que l’on peut avoir?
«Profil» et «profile & niveau»
Dans la «Classification des principales techniques d’analyse des données», quelles sont les types de niveaux que l’on peut avoir?
Analyse multidimensionnelle (MDS) Analyse typologique Analyse multidimensionnelle (INDSCAL) Analyse multivariée de la variance / De segmentation.
Comment appelle-t-on des facteurs qui sont totalement indépendants l’un de l’autre?
Des facteurs orthogonaux.
Avec quel modèle statistique fait-on des rotations?
Avec quel type de données effectue-t-on une rotation?
À quoi sert une rotation?
On fait des rotations dans des Analyses Factorielles.
Une rotation se fait avec les saturations (corrélations).
Une rotation sert à rendre les données plus lisible pour les êtres humains.
Que fait une rotation de données?
La rotation redistribue (les variances? saturations?) entre les facteurs retenus (VP > 1).
Ce qui permet de garder moins de facteur, donc de retrouver les dimensions les plus importantes (données plus faciles à traiter).
Mais on perd une partie de l’information initiale.
(Il s’agit de changer les axes de référence des observations, alors que ces observations restent au même endroit les unes par rapport aux autres.)
Quels sont les types de facteurs que l’on trouve en AF?
Expliquez-les.
- Facteur général: toutes les variables contribuent à ce facteur (profiles similaires).
- Facteur de groupe/unipolaire: sous-ensemble de variables qui saturent fortement et d’autres qui ne contribuent pas au facteur.
- Facteur bipolaire: saturations positives extrêmes et saturations négatives extrêmes.
Quels sont les risques inhérents d’un facteur?
¿¿¿Que le facteur résume aussi des biais et qu’ils soient redistribués sur les facteurs où la rotation a été effectuée.???
À quoi est sensible l’analyse en Cluster?
Au niveau (moyennes).