P2 Aprendizaje Flashcards
(21 cards)
Machine Learning
estudio de algoritmos de computador que mejoran automaticamente con la experiencia
Agentes de aprendizaje
una función que asocia un vector de características con una clase.
Data Mining
El proceso de adquirir conocimiento a partir de un conjunto de datos
Desviación típica
Cuánto se desvía una variable respecto a su valor medio
Covarianza
Analiza al grado de dependencia entre dos variables por medio de un coeficiente K
El perceptron multicapa clasifica por medio de
Un umbral theta
El perceptron siempre converge cuando los datos son:
Linealmente separables
El algoritmo del vecino más cercano clasifica
En base a la similitud, que es la inversa de la distancia entre cualquier par de ejemplos
En el algoritmo del vecino más cercano, el ruido produce
Sobreajuste, que son clasificaciones incorrectas
Una solución para el sobreajuste en el algoritmo del vecino más cercano es:
Usar los k-vecinos más cercans
El algoritmo de vecino más cercano tiene complejidad
Asintótica
La ventaja de los árboles de desición es que
No son algoritmos de caja negra, pueden ser visualizados
El procedimiento para crear un árbol de desición implica
Ir agregando ramas empezando por las que más información aporten (cada rama es una variable)
Entropía
Mide la heterogeniedad de un conjunto de datos, entre más alta, más equilibrado está el conjunto
Ganancia de información
Ver cuál es el atributo que más información aporta para tomar una desición. Ese será la raíz del árbol
Cuando un atributo es continuo es necesario
Discretizarlo
Una Red Bayesiana se define como
B=(G,P). Donde G es un grafo dirigido acíclico y P es la distribución de probabilidad entre cada par (padre, hijo)
Pasos para el aprendizaje en un modelo de red Bayesiana
- Modelar la red
- Obtener los valores de la estructura de probabilidad
El modelo Naive Bayes
Asume que todas las variables atributo son condicionalmente independientes dada la variables clase
El grafo del modelo Naive Bayes se compone de
La raíz que es la clase y las hojas que son los atributos (todos independientes)
En los árboles de decisión, cada nodo es ____, cada arco es ____ y cada hoja es ___
Cada nodo es una variable atributo, cada arco es un valor de esa variable y cada hoja es el valor de la variable clase