B02-T04-Business intelligent Flashcards
(48 cards)
Definición de Business Intelligence
Integración almacenamiento de datos más anílisis. Datos + conocimiento
RaícesBI
EIS -> Executive information system
+ DSS -> Decision support System.. Analizar datos de diferente procedencia
Fases de BI
Planificación y establecimiento de necesidades y requerimientos
Recopilación de datos (Data Collection)
🔹 Se recogen datos de múltiples fuentes: bases de datos, sistemas ERP, CRM, hojas de cálculo, etc.
🔹 Puede incluir datos estructurados y no estructurados.
Integración y limpieza de datos (ETL: Extract, Transform, Load)
🔸 Extracción (Extract): se toman los datos desde diferentes orígenes.
🔸 Transformación (Transform): se limpian, normalizan y ajustan para su análisis.
🔸 Carga (Load): se introducen en un almacén de datos (Data Warehouse o Data Lake).
Almacenamiento de datos (Data Warehousing)
Los datos procesados se guardan en un sistema estructurado para facilitar su consulta y análisis.
🔹 Aquí entran conceptos como OLAP, cubos de datos, dimensiones, hechos, etc.
Análisis de datos (Data Analysis)
🔹 Aquí entra el uso de herramientas como Power BI, Tableau, Qlik, etc.
Visualización y presentación (Reporting & Visualization)
🔸 Se generan informes, dashboards y gráficos interactivos para la toma de decisiones.
🔸 La información debe ser clara, visual y orientada a negocio.
Toma de decisiones (Decision Making)
🔹 Gracias a los análisis, los responsables pueden tomar decisiones informadas y estratégicas.
Beneficios BI
Disminución tiempo recolección info
Automatiza asimilación
Herramientas de análisis
Generación dinámica de reportes
Formulación y respuestas de preguntas
Realizar predicciones
Consulta sencilla e intuitiva de datos
Definición de Data Warehouse y características principales
Base de datos multidimensional y centralizada donde se almacena la información homogeneizada de diferentes fuentes
Características:
- Orientada a negocio (eliminación datos superfluos)
- Integrada: diferentesfuentes de datos
- Variante en el tiempo: todo dato tiene cuando ingresa tiene marca de tiempo.
- No volátil: no se altera el dato a lo largo del tiempo
- Gran cantidad de datos
- Información redundante, no normalizada
- Maneja información histórica
- Refiere también a las herramientasde consulta y de presentación de la información
Desventajas Data Warehouse
- Gran inversión
- Resilencia al cambio
- Posible atentado privacidad
- Infravaloración
Estructura de datos de una Data Warehouse
- Detalle de datos actuales
- Histórico de datos pasados
- Datos ligeramente resumidos
- Datos altamente resumidos
- Metadatos
Cuáles es el flujo de datos en una Data Wareehouse
Entran en el área de datos actuales, ocupando espacio en disco. Pueden ocurrir varias cosas:
- Que se resuman
- Que se almacenen como históricos
- Que se borren
Como opera a muy alto nivel un DW
- Los datos son extraídosdefuentes externas
- Datos limpiados, transformados y cargados en el DW
- Información estructurada en cubosmultidimensionales
- Los usuarios acceden a los cubos utilizando diferentes herramientas
Los diferentes grupos de artefactos en un DW
- OLTP: fuentes externas de datos
- Load manager: extracción, transformación y carga
- DW manager
- Query manager
- Herramientas de consulta y análisis
- Usuarios
Qué significa OLTP
Online Transaction Proccesing. Proceso por el cual se extrae los datos de diferentes fuentes
Donde carga los datos en primera instancia el Load Manager
En una carga intermedia paramanipular los datos sin interferir en el OLTP ni el DW.
Aquí se almacenan y gestionan los metadatos.
Facilita la integracióndediferentesfuentes
Ejemplos de tipos de transformación del Load Manager
- Codificación (0,1, true,false)
- Medida de atributos (pulgadas, centímetros, etc)
- Convenciones de nombres
- Fuentes múltiples de un mismo dato. Seleccionar la más fiable.
- Limpieza de datos. ignorar, reemplazar, eliminar, esperar disponibilidad datos faltatntes
Comenta aspectos relacionados con la carga en el Load Manager
Carga inicial
Actualización o mantenimiento periódico
Mantener estructura del DW: relaciones n,m claves subrogadas, dimensiones lentamente cambiantes, dimensiones degeneradas
Qué es la ETL
Extracción, carga y transformación y carga en el DW
Funciones del DW manager
- Almacenamiento de datos de forma multidimensional
- Gestionar las diferentes estructuras de datos (cubo multidimensional, businness models)
- Gestiona y mantiene los metadatos
- Transformaeintegra datos para toma decisiones
- Definición y manipulación del depósito de datos
- Aplicar políticas de particionamiento
- Realizar backups
Definición de datos multidimensional
Los datos se almacenan a través de
tablas de hechos y tablas de dimensiones.
Permite el acceso flexible a los datos
Tipos de tablas que puedes en encontrar en una base de datos multidimensional
- Tabla de dimensiones
- Tabla de hechos (agregadas, preagregadas)
- Tabla temporal
Habla de las tablas de dimensiones
- Contienen datos cualitativos, es decir, los datos de referencia no normalizados.
- Posibles campos: primary key, foring key, datos de referencia primarios (nombre cliente), datos de referencia secundarios (email, etc.)
- Tienen una marca temporal
Comenta todo lo que sepas de las tablas de hechos
https://miro.com/app/board/uXjVIe-jujk=/
Tipos de variantes de modelado
- Esquema en estrella (Star Scheme)
- Esquema copo de nieve (Snowflake Scheme)
- Esquema constalación o de estrellas (Starflake Scheme)
Esquema en estrella (Star Scheme)
Una tabla de hechos central y varias tablas de dimensiones
Debe estar desnormalizado
Esquema copo de nieve (Snowflake Scheme)
Una tabla de hecho central relacionada con varias tablas tablas de dimensiones a su vez relacionados con otras tablas dimensiones
Tablas más normalizadas
Características:
- Mayor complejidad
- Mejor utilización espacio
- Util en tablas muchas tuplas
- Normalizadas
Esquema constelación o de estrellas (Starflake Scheme)
Una tabla hechos central - Tablas de dimensiones- Tabla de hechos
Es decir se produce una relación indirecta entre tablas de hechos
Ventaja: Aspectos clave del negocio con mínimo esfuerzo adicional