Tercer Parcial Flashcards

Question

Protocolos basados en el bloqueo

Answer 1

**Protocolos Basados en el Bloqueo:** - **Objetivo:** Asegurar que una transacción acceda a un elemento a la vez para mantener la secuencialidad. - **Componente Clave:** Gestor de control de concurrencia, que autoriza o niega los bloqueos. - **Tipos de Bloqueos:** a. **Compartidos:** Permiten solo lectura de datos. b. **Exclusivos:** Permiten lectura y escritura de datos. - **Bloqueo Compatible:** - Dos transacciones pueden pedir bloqueos COMPARTIDOS, permitiendo la lectura pero no la escritura al mismo tiempo. - Si una transacción necesita escribir, espera a que se libere el bloqueo. - **Solicitud de Bloqueo:** - Si una transacción solicita un bloqueo y está disponible, se le concede sin conflicto. - **Inanición (Livelock/Starvation):** - Fenómeno donde una transacción es forzada a hacer ROLLBACK debido a conflictos recurrentes de bloqueo.

Answer 2

**Protocolo de Bloqueo de 2 Fases:** - **Propósito:** Evitar problemas de concurrencia. - **Etapas:** 1. **Fase de Crecimiento:** - La transacción solicita todos los bloqueos que necesita. - Cuando obtiene el último bloqueo, alcanza el "Punto de Bloqueo". 2. **Punto de Bloqueo:** - La transacción tiene todos los bloqueos y puede realizar sus operaciones. 3. **Fase de Decrecimiento:** - La transacción libera los bloqueos después de completar sus operaciones. - **Secuencialidad en Cuanto a Conflictos:** - Garantiza que las operaciones sigan un orden coherente. - **Problema No Resuelto:** - No aborda la posibilidad de retroceso en cascada. - **Tipos:** a. **Estricto:** - La transacción mantiene bloqueos exclusivos hasta su compromiso. Nadie más puede leer o escribir el dato. b. **Riguroso:** - La transacción mantiene TODOS sus bloqueos hasta su compromiso. En resumen, el Protocolo de Bloqueo de 2 Fases divide las solicitudes y liberaciones de bloqueos en dos etapas para mantener un orden secuencial, pero no resuelve el problema de retroceso en cascada. Los tipos estricto y riguroso determinan cuánto tiempo una transacción retiene sus bloqueos.

Answer 3

**Protocolo de Bloqueo de 2 Fases con Intención de Bloqueo:** este protocolo simplifica la gestión de bloqueos dividiendo la base de datos y permitiendo bloquear partes específicas según lo que necesitas hacer. Ayuda a que las operaciones se realicen de manera ordenada.

Answer 4

Exclusivo (X) Leer y escribir el nodo o los nodos inferiores. Compartido (C) Leer los nodos inferiores. Intencional compartido (IC) Permite pedir bloqueo IC o C en un nodo inferior. Intencional exclusivo (IX) Permite pedir bloqueo IX o X en un nodo inferior. Intencional exclusivo y compartido (IXC) Es una combinación de bloqueo IX con bloqueo C, por lo que permite pedir bloqueos para leer varios nodos, pero escribir solamente en uno o algunos.

Answer 5

En los esquemas multiversión, cada modificación crea una nueva versión del dato en lugar de cambiar el original. Cuando lees, el sistema decide qué versión mostrarte, y los bloqueos evitan problemas al leer datos que están siendo modificados por otras transacciones.

Answer 6

En la ordenación por marcas temporales multiversión, cada transacción recibe una marca temporal antes de ejecutarse, determinando el orden de las operaciones. Esto garantiza un orden lógico de las operaciones y permite lecturas sin bloqueos. A pesar de su beneficio en secuencialidad, tiene desventajas como la necesidad de accesos adicionales al disco para actualizar marcas temporales, la resolución de conflictos mediante retrocesos y la posibilidad de planificaciones no recuperables y retrocesos en cascada.

Answer 7

**Esquema de Bloqueo de 2 Fases Multiversión:** En este esquema, destinado a transacciones de lectura y actualización, las transacciones de actualización adoptan un bloqueo de dos fases riguroso, manteniendo todos los bloqueos hasta el final de la transacción. No poseen una marca temporal al inicio, y su secuenciación se basa en el orden de terminación. Las transacciones de lectura, en cambio, se les asigna una marca temporal al inicio, siguiendo un protocolo de ordenación por marcas temporales multiversión para realizar lecturas. La marca temporal, representada por un contador, es única para cada valor de dato, facilitando la gestión de concurrencia en este esquema.

Answer 8

**Niveles de Aislamiento en Transacciones:** 1. **Read Uncommitted (Lectura no comprometida):** - Permite que una transacción lea datos que están siendo modificados por otras transacciones, incluso si aún no se han confirmado. El nivel más bajo de aislamiento. 2. **Read Committed (Lectura comprometida):** - Garantiza que las transacciones solo lean datos confirmados. Evita lecturas de datos no confirmados, pero puede permitir lecturas inconsistentes debido a modificaciones en curso. 3. **Repeatable Read (Lectura repetible):** - Evita que otras transacciones modifiquen datos leídos por una transacción hasta que esta se complete. Asegura la repetición consistente de las lecturas durante la transacción. 4. **Serializable (Secuenciable):** - Proporciona el mayor nivel de aislamiento. Evita que otras transacciones realicen cualquier operación en los datos leídos por una transacción hasta que esta se complete, garantizando consistencia. Cada nivel ofrece un equilibrio diferente entre consistencia y concurrencia, permitiendo a los usuarios ajustar la configuración según sus necesidades específicas.

Answer 9

**Interbloqueo en Transacciones:** El interbloqueo sucede cuando una transacción espera por un recurso bloqueado por otra, creando conflicto. Aunque son inevitables, existen métodos para abordarlos: 1. **Prevención de Interbloqueos:** - Métodos que buscan evitar que el interbloqueo ocurra en primer lugar. 2. **Temporizaciones:** - Una transacción solicita un bloqueo por un tiempo; si no se otorga, se retrocede. En caso de interbloqueo, las transacciones involucradas retroceden. 3. **Detección y Recuperación:** - Revisión periódica en busca de interbloqueos. Si se detecta, se intenta recuperar retrocediendo transacciones. Estos métodos gestionan los desafíos del interbloqueo en sistemas de bases de datos.

Answer 10

Base de Datos: Almacén de datos organizados. Sistema de Gestión de Bases de Datos (SGBD): Software encargado de administrar y facilitar el acceso a la base de datos. Sistema Operativo: El software en el que se ejecuta el SGBD. Aplicación: Programas que interactúan con los datos del SGBD de manera bidireccional. Servidor: La máquina física que alberga la base de datos. Red: La vía a través de la cual los datos se transmiten entre la computadora del usuario y la base de datos. Físico: Acceso al lugar físico que alberga los servidores, a la red o a la computadora. Humano: Representa el eslabón más débil y susceptible a diversos ataques para obtener acceso a los datos.

Answer 11

Restricciones: Dominio. Tipo de dato. Integridad referencial. Otras, establecidas mediante triggers. Recuperación ante fallos: back up. Control de concurrencia. Autorizaciones. Vistas/stored procedures. Cifrado.

Answer 12

**Privilegios en Bases de Datos:** Un **privilegio** es una autorización que permite el acceso a partes específicas de una base de datos, y un usuario puede tener uno o varios privilegios. En el Sistema de Gestión de Bases de Datos (SGBD), se crean usuarios autorizados, se especifica su método de autenticación y se definen sus limitaciones. Además, estos usuarios pueden recibir la autorización para otorgar o denegar permisos a otros. El **Lenguaje de Control de Datos (DCL)** es una parte del lenguaje SQL que se encarga de la seguridad e integridad. La instrucción **GRANT** se utiliza para conceder autorizaciones y sigue el formato `GRANT ON TO `. Es posible otorgar privilegios globales que abarquen toda la base de datos o privilegios específicos para una tabla en particular. La lista de privilegios facilita la concesión de varios privilegios con un solo comando.

Answer 13

**Roles en Bases de Datos:** **Roles** permiten asignar un conjunto de privilegios a usuarios con funciones similares. En la base de datos, se crean roles y las autorizaciones a estos son similares a las que se otorgan a usuarios. Cualquier autorización que pueda concederse a usuarios también puede concederse a roles. La sintaxis para crear roles en SQL es simple: `CREATE ROLE `. En resumen, los privilegios de usuarios o roles incluyen: a. Todos los privilegios otorgados directamente al usuario o rol. b. Todos los privilegios otorgados a los roles que se han concedido al usuario o rol. Además, puede haber cadenas de roles, donde roles específicos heredan privilegios de roles más generales.

Answer 14

Para retirar una autorización se emplea la instrucción REVOKE. Su forma es casi idéntica a la de GRANT: REVOKE ON FROM Cuando la retirada de privilegios de un usuario o rol provoca que otros usuarios o roles también pierdan esos privilegios ocurre lo que se llama retirada en cascada. Éste es el comportamiento predeterminado. Puede restringirse utilizando la cláusula RESTRICT: en ese caso, el sistema devuelve error si se produce una retirada en cascada y no lleva a cabo la acción de retirada.

Answer 15

**Cifrado:** El **cifrado** es una técnica que protege o autentica datos, mensajes o usuarios mediante la aplicación de un algoritmo criptográfico. El objetivo es hacer que el mensaje sea incomprensible para aquellos que no tienen la autorización adecuada, mientras que aquellos con la clave pueden descifrarlo. Una buena técnica de cifrado debe permitir que los usuarios autorizados cifren y descifren datos de manera relativamente sencilla. Existen dos formas de cifrado: 1. **Sin clave:** Se encripta y desencripta conociendo el algoritmo, lo que significa que cualquiera que comprenda el algoritmo puede acceder, lo cual puede ser una desventaja. 2. **Con clave:** Se añade una clave al proceso. Hay dos tipos: - **Simétrico:** Emisor y receptor utilizan la misma clave para encriptar y desencriptar. Si alguien más conoce la clave, puede enviar o leer mensajes. Si solo uno conoce la clave, la operación no se completa, y si un tercero la intercepta, puede acceder. - **Asimétrico:** Se utilizan dos claves, una para cifrar y otra para descifrar.

Answer 16

**Cifrado Asimétrico:** En el cifrado asimétrico, cada usuario tiene dos claves: una pública y una privada. La clave pública está disponible para todos, mientras que la clave privada es secreta. Cuando alguien envía un mensaje, lo cifra con su clave privada, y el receptor lo descifra con la clave pública del emisor. En la respuesta, el proceso se invierte: el receptor cifra su mensaje con la clave pública del destinatario. Esto asegura que solo el destinatario pueda leer la respuesta y que el mensaje no haya sido alterado durante la transmisión.

Answer 17

**Hash y Seguridad de Contraseñas:** El hash es un cifrado irreversible que se utiliza para proteger contraseñas. En lugar de almacenar las contraseñas, se les aplica un hash y se guarda ese valor cifrado. Cuando un usuario intenta iniciar sesión, se compara el hash almacenado con el generado a partir de la contraseña ingresada. Esto protege las contraseñas de exposiciones en caso de un ataque. Para evitar ataques de diccionario, se utiliza un "salt" que agrega caracteres aleatorios, como concatenar la contraseña al ID del usuario. Esto asegura que aunque dos usuarios tengan la misma contraseña, los hashes resultantes sean diferentes.

Answer 18

**Firma Digital:** La firma digital utiliza el hash para asegurar la autenticidad de un mensaje. Se aplica el hash al mensaje y se cifra con la clave privada del emisor. Al descifrarlo con la clave pública y aplicar el hash, si coinciden, el emisor y el mensaje son auténticos. La firma garantiza que el creador no pueda negar su autoría.

Answer 19

Para encriptar los datos de una BBDD. Funciones de cifrado con claves embebidas en el DBMS. En el contexto de las bases de datos, el cifrado se puede llevar a cabo en diferentes niveles. Nivel inferior → bloques de disco que contienen datos se cifran usando clave disponible para el software del SGDB. En los sistemas de bases de datos compartidos se aplica el cifrado antes de que los datos lleguen a la base de datos.

Answer 20

Sistemas operacionales = son sistemas de información que dan soporte a los procesos del nivel operativo, se realizan las actividades de rutina, apoyados por sistemas informáticos, denominados transaccionales u operacionales.

Answer 21

Bases de datos OLTP (On Line Transactional Processing) = BBDD que dan soporte a los sistemas de nivel operativo.

Answer 22

Estas bases de datos soportan procesos con las siguientes características: Transacciones que actualizan un conjunto de pocos registros. Transacciones que consultan un conjunto de pocos registros. Puede existir un alto nivel de concurrencia de las transacciones que consultan y actualizan. Son operaciones de actualización y consultas en línea (online) que deben tener una respuesta instantánea para no trabar las operaciones de la organización.

Answer 23

Debido a dichas características de procesamiento, estas bases de datos suelen tener las siguientes características: Preparadas para recibir muchas transacciones de pocos registros. Alto desempeño (performance) en el acceso a los registros y a su actualización. Alta disponibilidad. Normalizadas para favorecer la actualización en línea y disminuir la probabilidad de inconsistencias que podrían generarse (lo que no implica que no exista redundancia). Índices que favorezcan la actualización en línea. Incluyen métodos de recuperación (para deshacer y rehacer transacciones) que aseguren la consistencia de la base de datos ante fallos en el sistema. Incluyen protocolos de control de concurrencia que aseguren la consistencia de la base de datos ante actualizaciones concurrentes.

Answer 24

Deficiencias por las que las BBDD OLTP no sirven para toma de decisiones tácticas y estratégicas: 1. Información no integrada: la informacion está dispersa y no representa realidades para decisiones tacticas o estrategicas. La informacion esta en parcialidades independientes; en BBDD con diseños conceptuales y fisicos distintos. Puede deberse a divisiones funcionales, geográficas o por unidades de negocio. A. Existen diferentes visiones de una misma realidad entre los directivos de la organización. B. Imposibilidad obtener información integrada que permita comparar, clasificar y consolidar como un todo. 2. Inadecuados tiempos de respuesta: para niveles tácticos y estratégicos se utiliza acceso y procesamiento de importantes volúmenes de datos. OLTP hace muy difícil obtener adecuados tiempos de respuesta. Además, hacen más lento el resto de las operaciones, ya que los recursos de la computadora estarán ocupados respondiendo a sus requerimientos. A. Inadecuados tiempos de respuesta para las consultas que apoyan la toma de decisiones. B. Se entorpece el nivel de respuesta de los sistemas de nivel operativo, debido al uso intensivo de recursos informáticos, que genera el procesamiento de las consultas para la toma de decisiones. 3. Imposibilidad de realizar consultas ad hoc amigables: los tomadores de decisiones necesitan poder acceder a la BBDD sin tener mucho conocimiento.

Answer 25

Data Warehouse (DW) = BBDD concebida y administrada para dar soporte a la toma de decisiones, posee datos representativos, esta optimizada para consultas de muchos registros y no precisan que la actualizacion sea en tiempo real. DW debe dejar como resultado una BBDD integrada, con datos que permiten toma de decision de niveles tacticos y estrategicos. De todas formas tambien puede ser utilizada por nivel operativo

Answer 26

Inteligencia de negocios (Business Intelligence, BI) = solución donde se usan los datos para una administración “inteligente”. Herramientas de exploración y explotación de datos que den soporte a la toma de decisiones. Una solucion BI suele tener un DW y herramientas: análisis multidimensional, tableros de control, alertas, reportes, etc.

Answer 27

Si el problema es información no integrada e inadecuados tiempos de respuesta, el DW puede proveer importantes beneficios. Si existe el problema de no disponer de herramientas para obtener información ad hoc en forma amigable, entonces se deben explorar las tecnologías encuadradas bajo el BI.

Answer 28

Fuentes de datos: todos los datos en sus BBDD de origen, que se extraerán mediante una serie de procesos ETL (Extract, Transformation, Load) para pasar al DW. Datos de sistemas operacionales, datos externos, datos internos no sistematizados informáticamente. Área del DW: incluye todos los datos que se integran para brindar información para la toma de decisiones en forma eficaz y eficiente. Esta área puede ser dividida en 3 subáreas: 1. Área de trabajo: transformaciones de datos, limpieza, combinación, homogeneización, equivalencias de códigos, agregaciones de consistencia, etc. Datos no listos para ser consultados, espacio de preparacion. 2. DW objetivo o detallado: BBDD con todos los datos, mayor nivel de desagregacion. Representa la realidad. 3. DW subjetivo o agregado: una o más BBDD (data marts), o por ambas. Construida segun las necesidades de los usuarios para la toma de decisiones y las herramientas a utilizar. Se nutre del DW objetivo. El principal objetivo de los data marts es lograr una mejor performance, son BBDD mas especificas. Herramientas de acceso y exploración de datos: Lo que ven los usuarios. Distintas herramientas que se usan para explorar los datos, cubre diversos criterios y estilos de analisis (análisis multidimensional, reportes, alertas, etc.).

Answer 29

Procesamiento OLAP Procesamiento que se enfoca en la consulta de grandes porciones de la base de datos para mostrar información principalmente agregada. Necesita el acceso y la recuperación de grandes cantidades de registros de la base de datos. Los niveles táctico y estratégico necesitan de este tipo de procesamiento para obtener información resumida y abarcar diversos períodos de tiempo que les permita detectar tendencias, problemas y aciertos.

Answer 30

Integrar los datos de los distintos sistemas OLTP. Cargar datos externos que sirvan para analizar variables relevantes del entorno. Centrar el diseño y administración de la base de datos para hacer eficiente el procesamiento OLAP. - Guardar datos precalculados. - Indices que optimicen consultas (sin preocuparse si son ineficientes en la actualización de datos). - Emplear redundancia. - Separar las bases de datos para que la alta concurrencia de la actualización que generan las transacciones OLTP no bloqueen las consultas OLAP.

Answer 31

Orientados a temas: datos no almacenanados con foco en eficacia y eficiencia sino para proveer información. Integrados: datos almacenados con un criterio unificado. Físicamente pueden estar centralizados o distribuidos. Histórico (variante en el tiempo): info debe permitir comparaciones, observar tendencias y considerar la evolución. La necesidad de conservar los datos en un DW por períodos prolongados (ventana temporal). La necesidad de que exista esta variable como un atributo significativo en los datos que se almacenan. No volátiles: se refiere a que los datos almacenados no son modificados, sino que solamente serán insertados agregando los nuevos hechos ya ocurridos y respetando la historia ya registrada.

Answer 32

ETL (Extraction, Transformation and Load; extracción, transformación y carga) = conjunto de procesos mediante los cuales se genera y actualiza el contenido del DW. Resuelven la homogeneizacion de datos provenientes de diversas fuentes. Extraer: acceder y tomar datos de las distintas fuentes. Transformar: transformaciones necesarias para dejar los datos en el formato, codificación, niveles de agregación, de calidad y criterios de integración que se definan. Cargar: actualizar el DW con dichos datos ya transformados.

Answer 33

Periodicidad (cada cuánto se ejecuta) y horario: con qué frecuencia es necesario tener datos actualizados. Secuencia: en la que se ejecutan los n procesos que integran el ETL.

Answer 34

Data mart (mercado de datos) = BBDD con mismas características que DW, no representa la realidad de toda la organizacion sino solo respecto de un área o función de ella. Toman relevancia debido a la complejidad de la implementacion del DW.

Answer 35

Principales herramientas de las que se dispone para la implementación de controles, así como para la reducción de tiempos en las consultas. Los resultados de las consultas se pueden almacenar precalculados. Entre las desventajas de la redundancia se puede mencionar la mayor probabilidad de que existan inconsistencias y los mayores tiempos de actualización.

Answer 36

Reportes Permite distribuir informacion de rutina acerca de distintos aspectos. BI mas difundido, no requiere conocimientos adicionales para acceder a la información que necesita: su presentación, formato y contenido ya están definidos. Análisis multidimensional (exploración OLAP) Estilos de BI mas poderosos, se modela la problematica para ser estudiada a partir de hechos y dimensiones de análisis. El contexto para los hechos de negocio está dado por las dimensiones (tiempo, cliente, producto, etc.). El usuario tiene disponibles una serie de hechos (o medidas) y dimensiones con las cuales ir armando en forma dinámica la información que le sea de utilidad para su análisis. El usuario elije variables, filtra, agrega y desagrega información en forma dinámica, rápida y amigable, obteniendo la capacidad de llegar hasta niveles de detalle habiendo partido de valores globales. Estas herramientas permiten al usuario final sin conocimientos técnicos de bases de datos hacerle preguntas al DW en términos de negocio, usando conceptos del día a día, que conoce por el hecho de trabajar en ese entorno. Tableros de control Conjunto de indicadores predefinidos cuyo monitoreo periódico permitirá el conocimiento del estado de situación de la organización. El usuario puede consultarlas e incluso integrarlas con otro tipo de herramientas. Minería de datos (data mining) Analizar de forma automática (o semiautomática), mediante diferentes tipos de algoritmos y técnicas estadísticas, grandes conjuntos de datos con el objetivo de encontrar patrones que de lo contrario podrían permanecer ocultos. Se busca desarrollar modelos predictivos, que apuntan a disminuir la incertidumbre sobre un comportamiento futuro, o de modelos descriptivos, que se limitan a explicar mejor hechos ya ocurridos. Distribución proactiva Consiste en que el software de BI envíe y distribuya la información a los usuarios.. Estos envíos se clasifican según la circunstancia que genera su realización: Ocurrencia de un evento determinado en la base de datos: se delega en el software el monitoreo de ciertas variables del negocio para actuar sólo ante la ocurrencia del evento en cuestión. Planificación determinada con anterioridad: se envía información a una fecha y hora determinada. Repetitiva o no. Espontáneo de información (on demand): se da cuando un usuario está navegando por reportes, tableros de control, etc., y decide enviar en forma espontánea el resultado de su análisis a otros usuarios, tanto internos como externos.

Answer 37

Cuando una organización posee sucursales distribuidas en lugares alejados geográficamente puede adoptar varios esquemas: Independiente: sin conexión entre los SGBD de las distintas sucursales. Centralizado: hay una sola base de datos en la casa matriz de la organización y las distintas sucursales se comunican de alguna forma con ella para acceder a los datos (ya que no tienen SGBD). Independiente con acceso compartido: los diferentes SGBD de las sucursales pueden acceder a los datos de otra a través de un link que los dirige a la misma (autenticación mediante). Independiente con acceso compartido web service: al esquema anterior se le añade una aplicación (web service) que recibe peticiones y envía respuestas a los SGBD de las distintas sucursales. Envía y recibe los datos que mandan los SGBD en respuesta a las solicitudes de los otros SGBD. El formato o estándar utilizado es el XML. Distribuido: bases de datos en distintos lugares físicos (denominados nodos) que funcionan de forma paralela y que lógicamente se comportan como una sola base de datos. Tener varios nodos permite alta disponibilidad de los datos al dar mayor respuesta en caso de que se caiga uno de los nodos. A. Homogéneas: todos los puntos usan el mismo software de gestion de base de datos, hay nocion de existencia de otros y cooperan en el procesamiento de las solicitudes. Localmente renuncian a la autonomia para modificar esquemas o SGDB. B. Heterogéneas: puede que distintos puntos usen distinto software de gestion de base de datos, no necesariamente hay nocion de existencia de los demas y algunos pueden tener informacion limitada para la cooperacion en procesamiento de consultas.

Answer 38

Réplica: cada modificación en una de las bases (nodos) se copia y se graba en los restantes nodos. Ventajas 1. Disponibilidad: Si alguno de los sitios que contiene una relación falla, la misma puede hallarse en otro sitio distinto (los otros nodos cubren al nodo que se cayó). Por tanto, el sistema puede seguir procesando las consultas que impliquen esa relación, pese al fallo del sitio (posee mayor tolerancia a fallos). 2. Paralelismo incrementado: En el caso en el que la mayoría de los accesos a una relación sólo resultasen en lecturas, diferentes sitios podrían procesar en paralelo las lecturas que impliquen a esa relación. Cuantas más réplicas de la misma existan, mayor será la posibilidad de que los datos necesarios se encuentren en el sitio en que se ejecuta la transacción. Por tanto, la réplica de los datos minimiza su transmisión entre los diferentes sitios. Desventaja Sobrecarga incrementada en la actualización: El sistema debe asegurar que todas las réplicas de una relación sean consistentes; en caso contrario pueden producirse cálculos erróneos. Por tanto, siempre que se actualiza esa relación, hay que propagar la actualización a todos los sitios que contienen réplicas. El resultado es una sobrecarga incrementada.

Answer 39

Réplica: cada modificación en una de las bases (nodos) se copia y se graba en los restantes nodos. Fragmentación horizontal: en cada nodo se guardan rangos de registros de todas las tablas. En algunas situaciones esto reduce el tráfico de red en las inserciones, modificaciones o eliminaciones, pero las consultas pueden demorar bastante. Fragmentación vertical: en cada nodo se guardan atributos de las distintas tablas, identificados en todos los casos por la PK. Para eso es necesario un criterio de fragmentación. Sirve cuando hay mas consultas o datos en una region.

Answer 40

Partición / fragmentación = buscar respuesta a la posibilidad de que se caiga o haya problemas de conexión entre los nodos. Puede generar problemas de disponibilidad o consistencia. Si hay problemas de conexión, y no se puede validar o controlar en línea, se pueden adoptar como cursos de acción: - Reducir las operaciones disponibles (no permitir la lectura y escritura de datos relacionados) y reducir la disponibilidad del sistema de datos. - Permitir las operaciones, pero hay que tener recaudos adicionales respecto a cómo se resuelven problemas de inconsistencia que puedan surgir.

Answer 41

Gestor de transacciones Cada sitio tiene su propio gestor local de transacciones, cuya función es garantizar las propiedades ACID de las transacciones que se ejecuten allí. Se encarga de: Mantener un registro histórico con fines de recuperación. Controlar la concurrencia del sitio. Coordinador de transacciones Coordina la ejecución de las diferentes transacciones (tanto locales como globales) iniciadas en el sitio. Se encarga de: Iniciar la ejecución de la transacción. Dividir la transacción en subtransacciones y distribuirlas a los sitios. Coordinar la terminación de la transacción (compromiso o aborto).

Answer 42

El Protocolo de 2 fases (C2F) para transacciones distribuidas consta de dos fases: Fase 1: El coordinador (Ci) agrega el registro al registro histórico y lo guarda en almacenamiento estable. Envia el mensaje preparar T a todos los sitios involucrados en la transacción T. En cada sitio, el gestor de transacciones decide comprometer o abortar su parte de T. Si es positivo, agrega al registro histórico y lo guarda. Si es negativo, agrega al registro histórico y responde con abortar T al coordinador. Fase 2: Cuando Ci recibe respuestas de todos los sitios o después de un tiempo predefinido, determina si T se compromete o aborta. T se compromete solo si Ci recibe T preparada de todos los sitios participantes; de lo contrario, T se aborta. Se agrega o al registro histórico, que se guarda en almacenamiento estable. Ci envía a todos los sitios el mensaje comprometer T o abortar T. El gestor de transacciones de cada nodo maneja operaciones afectando los datos en su nodo. Después de realizar operaciones, informa al coordinador antes de comprometer. El coordinador ordena comprometer subtransacciones en cada nodo, y los gestores pueden comprometer cuando reciben la orden. Si un gestor falla, se rehace la transacción. Si falla después de , consulta al coordinador al recuperarse. El coordinador decide basándose en los registros recibidos. Si el coordinador falla, los sitios deciden basándose en los registros históricos. En resumen, C2F garantiza que las transacciones distribuidas se ejecuten como una unidad, asegurando consistencia y confiabilidad en entornos distribuidos.

Answer 43

La consistencia eventual implica dividir el procesamiento de transacciones en fases, aceptando la falta de consistencia durante estas fases, pero asegurando que eventualmente se alcance un estado consistente. Este enfoque se utiliza para garantizar la disponibilidad en situaciones de desconexión entre nodos. En sistemas como Cassandra, cuando se detecta una partición debido a problemas de conexión, cada nodo opera de manera independiente. Al resolver la desconexión, el sistema se recupera utilizando datos adicionales guardados durante la partición y protocolos específicos para lograr una consistencia eventual. Este enfoque permite mantener la operatividad durante las particiones, pero requiere protocolos para detectarlas, gestionar datos adicionales y resolver posibles inconsistencias, llevando el sistema de nuevo a un estado consistente una vez que la partición se resuelve.

Answer 44

MongoDB, una base de datos semiestructurada distribuida, se enfoca en la partición de datos en múltiples nodos para distribuir, paralelizar y redundar operaciones de escritura y lectura. Su estructura documental almacena datos en colecciones compuestas por documentos similares a objetos JSON. Utiliza BSON, una representación binaria de JSON con extensiones para tipos de datos adicionales. Los índices, de estructura de Árbol B, admiten tipos como simples, compuestos, geoespaciales y texto. MongoDB permite réplicas distribuidas mediante conjuntos de réplicas, con un nodo primario y secundarios. En un esquema de replicación, la aplicación escribe y lee en el nodo primario, que replica datos a los secundarios. La replicación es asincrónica, y en caso de falla del primario, se elige un secundario como nuevo primario. Para aumentar la disponibilidad, las lecturas pueden realizarse en los secundarios. La distribución de documentos se logra mediante la fragmentación de colecciones usando una clave shard inmutable. La replicación ofrece redundancia, mejora la disponibilidad, aumenta la localidad de los datos y permite recuperación de desastres o backup.

Answer 45

Blockchain es una tecnología de base de datos distribuida que almacena registros en forma segura y transparente mediante una red de nodos. Cada registro, llamado "registro contable distribuido", describe eventos específicos y se añade a una cadena de bloques. Las transacciones en blockchain, como en Bitcoin, implican emisión de monedas o transferencias entre usuarios, y son irreversibles, permitiendo solo inserciones de nuevas transacciones. La red blockchain consiste en nodos independientes que mantienen copias de los registros, almacenados de forma permanente. La tecnología utiliza un protocolo que dicta la entrada, validación, almacenamiento y sincronización de datos, encriptados con firmas digitales para garantizar la integridad sin necesidad de intermediarios. En cada transacción, todas las partes deben proporcionar su aceptación mediante claves privadas, y la red verifica su capacidad. La transferencia de activos requiere el consenso de las partes y la confirmación en la mayoría de los nodos de la red.

Answer 46

Registro: Es el elemento que se desea almacenar en la base de datos. Pueden ser o representar cualquier componente que pueda ser descripto en forma digital. Transacción: Es un movimiento de cambio de posesión de un registro entre dos propietarios, la adición o edición de un activo, o el registro de un hecho. Bloque: Conjunto de transacciones a registrar. Cadena: Es el conjunto de bloques que componen todos los datos y transacciones registradas en la base de datos. Los bloques se encuentran interrelacionados utilizando criptografía y asegurando una linealidad temporal. Toda blockchain es encabezada desde su inicio por un bloque especial denominado “Bloque Genesis”, que no tiene el código hash del bloque anterior aceptado. Protocolo: Son las reglas a través de los cuales se determina como las entradas son iniciadas, validadas, registradas y distribuidas.

Answer 47

Cuando se desea registrar una transacción en blockchain, se comunica a la mayor cantidad de nodos posibles, se verifica su origen e integridad, y se incluye en un bloque. Este bloque se agrega a la cadena y se comunica a más nodos. La tecnología utiliza hashes y un "salt" para garantizar la seguridad. Los mineros realizan pruebas de trabajo para añadir bloques, y las bifurcaciones se resuelven aceptando la cadena más larga. La seguridad radica en la dificultad computacional y la red descentralizada, haciendo ataques poco prácticos.

Answer 48

Blockchain no garantiza propiedades ACID como durabilidad y consistencia todo el tiempo. Aunque asegura aislamiento y atomicidad, trabaja con consistencia eventual. La base de datos queda en un estado no consistente durante el proceso de aceptación y replicación.

Answer 49

Inmutabilidad de la información, reduciendo la posibilidad de fraude. Semi-anonimato, utilizando claves públicas en lugar de identidades reales. Eliminación de intermediarios, reduciendo costos y complejidad. Transparencia al almacenar información sobre activos y cambios de propiedad. Robustez y recuperación ante fallos debido a la descentralización.

Answer 50

Las transacciones deben ser confirmadas mediante bloques validados. Garantiza inmutabilidad de datos al requerir consenso de todos los nodos. Impacto negativo en el desempeño debido a la encriptación de datos. Diseñado principalmente como repositorio de transacciones, no para tareas analíticas.

Answer 51

Blockchain es homogéneo, de réplica completa y eventual, sin fragmentación. La cadena más larga tiende a replicarse en todos los nodos eventualmente.

Answer 52

Desventaja en la sobrecarga al actualizar datos, pero no aplica directamente a blockchain. Uso redundante de recursos para obtener la prueba de trabajo afecta el rendimiento. Fortalezas incluyen seguridad, confianza en integridad y disponibilidad de datos. La falta de confirmación real y el bajo rendimiento comparado con bases de datos tradicionales son desafíos.

Tercer Parcial Flashcards

(76 cards)