CM02 Flashcards
(7 cards)
Gradient
Noyau Gx=[-1,0,1], Gx=[-1,0,1]' norme sqrt(gx2+gy2) orientation atan2(gx,gy)
SIFT
Scale-invariant feature transform
Détection de l’échelle par le noyau qui maximise réponse au laplacien.
Détection de coins : matrice hessienne H = |Dxx Dxy, Dxy Dyy| (gradient dans 2 directions), les valeurs propres représentent la courbure principale. Critère de Lowe rth=10, R = tr(H)2/det(H) < (rth+1)2/rth
Invariance rotationelle : histogramme des orientations du gradient pondérées par la norme, pic = orientation principale, on renormalise avec orientation 0)
SIFT : découpe en sous-pavage pour rendre plus robuste
Sac de mots
mots visuels détectés et normalisés par SIFT, clustering (non supervisé) par la méthode k-moyennes : points aléatoires, séparation puis déplacement vers le cen²troïde jusqu’à convergence, histogramme de codewords (fréquence) comme vecteur descripteur. On peut faire des histogrammes spatials.
HoG
Histograms of oriented gradients
Normalisation (NB), calcul des gradients (norme et orientation), histogramme des orientations pour chaque cellule (px), renormalisation du contraste dans chaque bloc, concatenation dans un vecteur.
Discrétisation des critères
RVB : 3 booléens pour éviter une relation d’ordre. Attention, normaliser les autres critères (taille de l’ordre de 100…) selon min-max ou N(0,1).
Classification multi-classe par classifieurs simples
- 1 vs all, k classes, k classifieurs (on prend le meilleur score)
- 1 vs 1, k classes, k(k-1)/2 classifieurs, système par votes, au moins k-1 classifieurs doivent reconnaître l’objet.
Dilemme, 1 vs all mieux si classifieur puissant, 1 vs 1 plus simple de séparer 2 classes mais coûteux.
Caractéristiques de Haar
Petits filtres binaires jouant sur les symétries, très rapide à calculer (image intégrale : g=D-C-B+A)