B02-T04-Business intelligent Flashcards

(48 cards)

1
Q

Definición de Business Intelligence

A

Integración almacenamiento de datos más anílisis. Datos + conocimiento

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

RaícesBI

A

EIS -> Executive information system
+ DSS -> Decision support System.. Analizar datos de diferente procedencia

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Fases de BI

A

Planificación y establecimiento de necesidades y requerimientos

Recopilación de datos (Data Collection)
🔹 Se recogen datos de múltiples fuentes: bases de datos, sistemas ERP, CRM, hojas de cálculo, etc.
🔹 Puede incluir datos estructurados y no estructurados.

Integración y limpieza de datos (ETL: Extract, Transform, Load)
🔸 Extracción (Extract): se toman los datos desde diferentes orígenes.
🔸 Transformación (Transform): se limpian, normalizan y ajustan para su análisis.
🔸 Carga (Load): se introducen en un almacén de datos (Data Warehouse o Data Lake).

Almacenamiento de datos (Data Warehousing)
Los datos procesados se guardan en un sistema estructurado para facilitar su consulta y análisis.
🔹 Aquí entran conceptos como OLAP, cubos de datos, dimensiones, hechos, etc.

Análisis de datos (Data Analysis)
🔹 Aquí entra el uso de herramientas como Power BI, Tableau, Qlik, etc.

Visualización y presentación (Reporting & Visualization)
🔸 Se generan informes, dashboards y gráficos interactivos para la toma de decisiones.
🔸 La información debe ser clara, visual y orientada a negocio.

Toma de decisiones (Decision Making)
🔹 Gracias a los análisis, los responsables pueden tomar decisiones informadas y estratégicas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Beneficios BI

A

Disminución tiempo recolección info
Automatiza asimilación
Herramientas de análisis
Generación dinámica de reportes
Formulación y respuestas de preguntas
Realizar predicciones
Consulta sencilla e intuitiva de datos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Definición de Data Warehouse y características principales

A

Base de datos multidimensional y centralizada donde se almacena la información homogeneizada de diferentes fuentes
Características:
- Orientada a negocio (eliminación datos superfluos)
- Integrada: diferentesfuentes de datos
- Variante en el tiempo: todo dato tiene cuando ingresa tiene marca de tiempo.
- No volátil: no se altera el dato a lo largo del tiempo
- Gran cantidad de datos
- Información redundante, no normalizada
- Maneja información histórica
- Refiere también a las herramientasde consulta y de presentación de la información

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Desventajas Data Warehouse

A
  • Gran inversión
  • Resilencia al cambio
  • Posible atentado privacidad
  • Infravaloración
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Estructura de datos de una Data Warehouse

A
  • Detalle de datos actuales
  • Histórico de datos pasados
  • Datos ligeramente resumidos
  • Datos altamente resumidos
  • Metadatos
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Cuáles es el flujo de datos en una Data Wareehouse

A

Entran en el área de datos actuales, ocupando espacio en disco. Pueden ocurrir varias cosas:
- Que se resuman
- Que se almacenen como históricos
- Que se borren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Como opera a muy alto nivel un DW

A
  • Los datos son extraídosdefuentes externas
  • Datos limpiados, transformados y cargados en el DW
  • Información estructurada en cubosmultidimensionales
  • Los usuarios acceden a los cubos utilizando diferentes herramientas
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Los diferentes grupos de artefactos en un DW

A
  • OLTP: fuentes externas de datos
  • Load manager: extracción, transformación y carga
  • DW manager
  • Query manager
  • Herramientas de consulta y análisis
  • Usuarios
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qué significa OLTP

A

Online Transaction Proccesing. Proceso por el cual se extrae los datos de diferentes fuentes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Donde carga los datos en primera instancia el Load Manager

A

En una carga intermedia paramanipular los datos sin interferir en el OLTP ni el DW.
Aquí se almacenan y gestionan los metadatos.
Facilita la integracióndediferentesfuentes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Ejemplos de tipos de transformación del Load Manager

A
  • Codificación (0,1, true,false)
  • Medida de atributos (pulgadas, centímetros, etc)
  • Convenciones de nombres
  • Fuentes múltiples de un mismo dato. Seleccionar la más fiable.
  • Limpieza de datos. ignorar, reemplazar, eliminar, esperar disponibilidad datos faltatntes
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Comenta aspectos relacionados con la carga en el Load Manager

A

Carga inicial
Actualización o mantenimiento periódico
Mantener estructura del DW: relaciones n,m claves subrogadas, dimensiones lentamente cambiantes, dimensiones degeneradas

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qué es la ETL

A

Extracción, carga y transformación y carga en el DW

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Funciones del DW manager

A
  • Almacenamiento de datos de forma multidimensional
  • Gestionar las diferentes estructuras de datos (cubo multidimensional, businness models)
  • Gestiona y mantiene los metadatos
  • Transformaeintegra datos para toma decisiones
  • Definición y manipulación del depósito de datos
  • Aplicar políticas de particionamiento
  • Realizar backups
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Definición de datos multidimensional

A

Los datos se almacenan a través de
tablas de hechos y tablas de dimensiones.
Permite el acceso flexible a los datos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Tipos de tablas que puedes en encontrar en una base de datos multidimensional

A
  • Tabla de dimensiones
  • Tabla de hechos (agregadas, preagregadas)
  • Tabla temporal
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Habla de las tablas de dimensiones

A
  • Contienen datos cualitativos, es decir, los datos de referencia no normalizados.
  • Posibles campos: primary key, foring key, datos de referencia primarios (nombre cliente), datos de referencia secundarios (email, etc.)
  • Tienen una marca temporal
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Comenta todo lo que sepas de las tablas de hechos

A

https://miro.com/app/board/uXjVIe-jujk=/

21
Q

Tipos de variantes de modelado

A
  • Esquema en estrella (Star Scheme)
  • Esquema copo de nieve (Snowflake Scheme)
  • Esquema constalación o de estrellas (Starflake Scheme)
22
Q

Esquema en estrella (Star Scheme)

A

Una tabla de hechos central y varias tablas de dimensiones
Debe estar desnormalizado

23
Q

Esquema copo de nieve (Snowflake Scheme)

A

Una tabla de hecho central relacionada con varias tablas tablas de dimensiones a su vez relacionados con otras tablas dimensiones

Tablas más normalizadas

Características:
- Mayor complejidad
- Mejor utilización espacio
- Util en tablas muchas tuplas
- Normalizadas

24
Q

Esquema constelación o de estrellas (Starflake Scheme)

A

Una tabla hechos central - Tablas de dimensiones- Tabla de hechos

Es decir se produce una relación indirecta entre tablas de hechos

Ventaja: Aspectos clave del negocio con mínimo esfuerzo adicional

25
Tipos de arquitectura OLAP
- Relacional (ROLAP) (esquema copo de nieve ..) - Multidimensional (MOLAP) (cubos) - Híbrido (HOLAP)
26
Que significan las siglas OLAP
Online Analytical Processing
27
Definición de cubo multidimensional
Representa los datos planos mostrados en columnas y filas en una matriz de N dimensiones Ya no solo hay dos ejes, sino que puede haber varios upor cada atributo. Una dimensión es una atributo. Y un indicador, es decir,una posición del cubo son los tres valores de los tres atributos que componen las dimensionalidades del cubo
28
Habla de todos los objetos que puedes encontrar en un cubo multidimensional
https://miro.com/app/board/uXjVIe-jujk=/
29
Tipos de metadatos
- De los procesos ETL - Operacionales - De consulta
30
Definición de metadatos
Información de localización estructura y significado de los datos
31
Funciones de los metadatos
- Facilitan el flujo de trabajo - Directorio de búsqueda - Mapping de cómo se transforman e integran los datos - Referencias a algoritmos utilizados - Definiciones sistema registro
32
Tipos de herramientas de análisis y consulta
- Reportes y consulta - OLAP - Cuadros de mando - Data mining - EIS
33
Fases para la creación de un cuadro de mando
- Análisis situación y obtención información - Análisis de la empresa y determinación funciones generales - Necesidades según prioridades y nivel informativo - Variables críticas - Correspondencia entre variables críticas y medidas precisas para su control
34
Característica principal a tener en cuenta durante la configuración de un cuadro de mando
Caracter de estructura piramidal. De cuadros menos resumidos a cuadors más resumidos
35
Es el cuadro de mando compatible con otras ISO
Si
36
Cuadro de mandos estratégico (CE) y cuadros de mando operativos (CO)
- (CE) Utiliza indicadores estratégicos - (CO) indicadores rutinarios ligados a áreas o departamentos específicos. Periocidad diaria, semanal, mensual
37
Metodología Kaplan & Norton
Utilizan indicadores financieros como no financieros: - Perspectiva financiera: valor empresa accionistas - Perspectiva cliente: posicionamiento de unaempresa en el mercado (tiempo,calidad, costo...) - Perspectiva interna: procesos internos - Perspectiva de aprendizaje y rendimiento
38
Definición de un CMI
Colección de reportes, consultas y análisis interactivos que hacen referencia a un tema en particular y están relacionados entre sí
39
Características generales de un CMI
- Información altameente resumida - Se compone de consultas, reportes, análisis interactivos, gráficos, etc - Evaluar la situación de la empresa - Formato visual llamativo - Más otientado al seguimiento indicadores que a la realización de análisis
40
Qué es un Data Mart
Es un DW restringiddo a un área funcional. Arquitecturas: - Top-Down: Primero se define el DW y luego los DM - Bottom-Up: Primero se definen los DM y luego los DW
41
Qué es un SGBD
Sistemas de gestión de bases de datos de manera clara y sencilla
42
Tipos de SGDB
- Multidimensionales: buena performance para la DW pero difícil degestionar - Relacionales: cada vez más potentes
43
Que es un BUSINESS MODELS
Representación de los datos desde una perspectiva empresarial por ejemplo el cubo multidimensional
44
Cuáles son las áreas de datos
- Staging Area: -Operation Data Store - Almacen de datos corporativos - Data Mart
45
Aŕea de datos Staging Area
Es una área temporal donde se recogen los datos del sistema origin Se aplica mínima trasformación. Se tratan como ficheros planos
46
Área de datos Operation Data Store
Da soporte a los sitemas operacionales. Formato normalizado, no almacena datos históricos, muestra la imagen del momento
47
Área de datos Almacen de datos corporativos
Contiene datos históricos y orientado explotación analítica Las herramientas DSS o de reporting analítico consultan los Data MArt como este
48
Data Mart
El lugar donde se crean los data mart Es como un subconjunto del almacén corporativo pero orientado a análisis