Chapter 2 Flashcards
Lochkamera
Kasten mit einem Loch, welches ein umgekehrtes Bild erzeugt
Bildverarbeitungsprozess mit dem Lochkameramodell
- Bild von der realen Welt wird von der Kamera erfasst
- wird von dem Digitalisierer rasterisiert
- es entsteht ein digitales Bild
Computervision vs. Computergrafik (Graustufen)
Computergrafik:
wie erzeuge ich ein Bild mit (versteckter) Information aus
Computer Vision:
wie erkenne ich die (versteckte) Information vom erzeugten Bild
Konfluenz
Zusammenfluss von Computer Vision und Graphics
Bayes Decision Theory
Ziel
klassifiziere neuen Buchstaben, so dass die Wahrscheinlichkeit der Fehlklassifikation minimiert wird
Was ist Sliding Window Approach?
Suchstrategie für Gesichtsdetektion
Wie funktioniert Sliding Window Approach?
zuerst wird das Bild gescannt und nach Gesichtern durchsucht
anschließend wird das Bild um 1,2 verkleinert und erneut gescannt
diese Schritte werden solange wiederholt, bis das Bild zu klein ist
Wie setzten sich die Trainingsdaten für Sliding Window Approach zusammen
möglichst vielfältige positive Beispiele, wobei jedes Bild eines Gesichts manuell an den Rändern abgeschnitten wird.
negative Beispiele, Bilder, die kein Gesicht enthalten, sowie Teilbilder von großen Bildern
Prior
P(Ck)
Wahrscheinlichkeit für das Auftreten der Klasse Ck
Likelihood
bedingte Wahrscheinlichkeit
P/x | Ck)
Wahrscheinlichkeit für das Auftreten von Merkmal x, wenn Ck gegeben ist
Posteriori
P(Ck | x)
Wahrscheinlichkeit für das Auftreten von Ck, wenn Merkmal x gegeben ist
Berechnung der a-posteriori-Wahrscheinlichkeit
Posteriori = (Likelihood x Prior) / Normalization Factor
P( Ck |x ) = ( P(x | Ck) mal P(Ck) ) / P(x)
Annahme: Naives Bayes Klassifikator
Merkmale sind statistisch unabhängig
Die Annahme ist oft nicht richtig, dennoch häufig gute Ergebnisse und somit ein guter Vergleicher
Identifikation vs. Verifikation
Identifikation:
biometrische Daten bekannt, danach wird der zugehörige Name ermittelt
Verifikation:
Name bekannt, danach entscheidet das System, ob dies die vorgegebene Person ist
Appearance Base Methods
Erscheinungsmodell aus großen Sammlungen von Bildern lernen
jedes Teilbereich des Bildes als Gesicht oder kein Gesicht klassifizieren
Aspekte: Appearance Base Methods
- Repräsentation des Objekts:
- lokale Merkmale (Auge,Mund) - Trainingsdaten:
- positive und negative Beispiele - Klassifikator und Lernmethode:
- Aspekt Repräsentation des Objekts
Appearance Base Methods
Darstellung der Gesichtsmerkmale mit Frequenzen und deren Ort und Orientierung
- Aspekt: Trainingsdaten
Appearance Base Methods
möglichst vielfältig
jedes Bild eines Gesichts wird manuell an den Rändern abgeschnitten und auf eine Standardgröße (z.B. 19x19) normalisiert
es werden virtuelle Beispiele erstellt
beliebige Bilder die keine Gesichter enthalten
Teilbilder von großen Bildern