Clase 9 - Regresión Logística / SVM Flashcards
(8 cards)
¿Qué mide cross-entropy, o log-loss?
Mide la calidad de la predicción. El valor es mayor si la predicción es peor.
Minimizar cross-entropy es maximizar likelihood.
¿Qué significa SVM?
Support Vector Machines
¿A qué llamamos Margen en SVM?
A la distancia más corta entre cualquier grupo de observaciones, y el threshold.
¿Qué es el Maximum Margin Classifier en SVM? ¿Qué pros y contras tienen?
Es el concepto de elegir el threshold que lleve al máximo el márgen.
Pros: funciona como clasificador de clusters; una nueva observación se va a clasificar siempre como el cluster más cercano a la misma.
Contras: muy sensible a outliers.
¿A qué llamamos vectores de soporte, o support vectors?
Llamamos así a las observaciones que están sobre el margen en Maximum Margin Classifier. Son las que “determinan” el margen.
¿Qué diferencia tiene un soft margin de un margin en SVM? ¿En qué clasificador se usa el soft margin?
Un margin es dada por la observación más cercana al threshold. Por tanto, en los datos de training no se permite que haya ninguna observación del lado incorrecto del margen.
El soft margin, por otro lado, no necesariamente es dado por la observación más cercana; puede estar dado por cualquier otra observación, y permite que haya observaciones del lado incorrecto del margen (o incluso del hiperplano).
El soft margin se usa en el Soft Margin Classifier, también llamado Suport Vector Classifier.
¿Por qué es bueno usar soft margins, si permite más clasificaciones erróneas?
Porque usando cross validation deduce qué clasificación erronea puede permitirse para mejorar las clasificaciones a futuro.
¿Qué es un Kernel en SVM?
Es una función que, dadas dos observaciones en una dimensión d, devuelve el producto interno de esas observaciones en un espacio expandido >d.