Introducción a la Explotación de Información Flashcards
(18 cards)
Defina que es la explotación de la Información
Es el proceso mediante el cual se extrae desde bases de datos el conocimiento comprensible y útil que previamente era desconocido, en diversos formatos, y en forma automática.
Defina Patrones
Modelo de referencia que se toma como caso para valorar a otros de iguales o similares características.
¿Para qué se usan los algoritmos TDIDT?
Se usan para el descubrimiento de reglas de comportamiento
¿Para qué se usan las Redes SOM?
Para el descubrimiento de grupos.
Para qué se usan las Redes Bayesianas?
Para la ponderación de interdependencia de atributos
Para qué se usan los algoritmos TDIDT y SOM?
Descubrimiento de reglas de pertenencia a grupos.
Para qué se usan los algoritmos TDIDT y Redes Bayesianas?
Ponderación de atributo relevante en reglas de comportamiento.
Para qué se usan los algoritmos TDIDT, SOM y Redes Bayesianas?
Ponderación de atributo relevante en reglas de pertenencia a grupos.
Enumere los pasos para un Proceso de Conocimiento:
- Limpieza de datos
- Integración de datos
- Selección de datos
- Transformación de datos
- Minería de datos (proceso para extraer patrones)
- Evaluación de patrones (identificación de patrones interesantes)
- Presentación de conocimientos
Haga un esquema de enfoques de solución en Minería de Datos.
- Problemas descriptivos
1. Análisis de segmentación
1. Análisis de asociaciones - Problemas predictivos
1. Clasificación
1. Predicción de valores
Defina Minería de Datos
Es el análisis de bases de datos con el fin de descubrir patrones, relaciones, reglas, asociaciones, excepciones que sean útiles para la toma de decisiones al rastrear y comparar información.
Mencione tres algoritmos de Minería de Datos
TDIDT (Top Down InDuction Trees)
Redes Neuronales (Self Organizing Maps)
Redes Bayesianas
Defina cuando aplicar el proceso de descubrimiento de reglas de comportamiento
Se aplican los algoritmos de inducción TDIDT cuando se requiere identificar cuales son las condiciones para obtener determinado resultado del dominio del problema.
Defina cuando aplicar el proceso de descubrimiento de grupos y cómo se llama
Se aplica cuando se requiere identificar una partición en la masa de información disponible sobre el dominio del problema y se llaman Mapas Auto Organizados de Kohonen o SOM
Desarrolle la función para el algoritmo SOM
1)Inicializar los pesos a números pequeños aleatorios, además fijar el ratio de aprendizaje y de vecindad inicial.
2)Presentar un patrón x, y evaluar resultados.
3)Seleccionar la unidad con el resultado mínimo
4)Modificar los pesos
5)Disminuir el valor del ratio de aprendizaje y reducir la vecindad
6)Repetir de paso 2 al 5 hasta que el cambio en los valores de los pesos sea menor del umbral o se alcance el número máximo de iteraciones.
Defina cuando aplicar el proceso de ponderación de interdependencia de atributos y cómo se llama
El proceso de ponderación de interdependencia de atributos se aplica cuando se requiere identificar cuales son los factores con mayor incidencia o frecuencia de ocurrencia sobre un determinado resultado del problema.
Desarrolle una función para las Redes Bayesianas
FUNCION CONSTRUYE_RED(VARIABLES)
Sea (X_1,…X_n) una ordenación de las variables de VARIABLES
Sea RED una red bayesiana ‘‘vacía’’
PARA i=1,…,n HACER
Añadir un nodo etiquetado con X_i a RED
Sea padres(X_i) un subconjunto minimal de {X_{i-1},…,X1}
tal que existe una independencia condicional entre X_i y cada
elemento de {X_{i-1},…,X1} dado padres(X_i)
Añadir en RED un arco dirigido entre cada elemento de padres(X_i)
y X_i
Asignar al nodo X_i la tabla de probabilidad P(X_i|padres(X_i))
Devolver RED
Dar una lista de procesos de explotacion de informacion
Los procesos para la explotación de información son:
- TDIDT (Top Down Induction Decisión)
- Redes Neuronales, Kohonen o SOM (Mapas Auto Organizados)
- Redes Bayesianas
- Algoritmos Genéticos