Preguntas Parcial Y Final Flashcards

Question

VoF? Un árbol de grado mayor a dos no puede ser representado mediante una representación computacional estática.

Answer 1

F. No se podría visualizar, pero se puede implementar una matriz multidimensional y poner todas las combinaciones.

Answer 2

F. El grado del árbol depende de la cantidad de claves que soporta por nodo y su load factor. Lo que no quiere decir que va a tener N+1 grado.

Answer 3

F. Solo se puede en árboles binarios. Para un arbol n-ario se puede aplicar el algoritmo de Knuth y transformarlo en binario.

Answer 4

V. El barrido simetrico, o también conocido inorden, evalua el nodo izquierdo, luego la raíz, y por último el nodo derecho, así recursivamente, por ende, siendo el ABB un arbol ordenado donde los nodos de la izquierda son menores a la raiz y los de la derecha mayores, cuando haces un barrido inorden se puede leer la secuencia ordenada.

Answer 5

F. El arbol lleno y el completo son dos propiediades de árboles.

Answer 6

F. La diferencia que tiene el árbol B+ es que tiene un número mínimo de claves por registro, que es la mitad al número máximo.

Answer 7

F. Solo se puede aplicar dichos barridos para árboles binarios. El barrido simétrico solo se puede realizar en árboles con n=2. Para eso es que se usa el algoritmo de Knuth, para transformar un árbol n-ario en binario y poder aplicarle el barrido simétrico.

Answer 8

F. El Arbol B es más óptimo para la búsqueda de claves secuenciales que el hashing. El hashing es más óptimo para la búsqueda de claves puntuales.

Answer 9

V. Es posible por medio del barrido por niveles, y con las operaciones sobre los índices para obtener los hijos de la rama izquierda y los de la rama derecha.

Answer 10

F. Para que sea un árbol no debe haber ciclos en el grafo y debe ser conexo. Independientemente del grado del grafo. Si el grafo es de grado 2, pero es cíclico, no nos encontraríamos con un árbol (por definición de árbol).

Answer 11

F. La complejidad computacional promedio es O(log n) y el peor de los casos es O(n).

Answer 12

F. Basta con solo contradecir la afirmación poniendo el arbol de la expresión: (10 + 5) * 3. Lo que daría 5 nodos, siendo este un número impar.

Answer 13

F. No necesariamente. Depende del tipo de barrido utilizado (PreOrden, InOrden, PostOrden) y de la expresión representada.

Answer 14

F. Pueden representarse mediante matrices de adyacencia, que es una estructura estática.

Answer 15

F. El espacio ocupacional de una representación dinámica de un grafo es O(V + A), mientras que el de una representación estática es de O(V2). La representación dinámica siempre aprovecha mejor el espacio, y es más flexible para el crecimiento del grafo, aunque tiene mayor costo de procesamiento. Mientras que la representación estática carece de dicha flexibilidad, pero tiene menor costo procesamiento. Si la cantidad de Vertices es de 0 o 1, la complejidad computacional es la misma para ambos, dado que a 0 vertices, no hay aristas, entonces O(0+0) = 0, y O(02) = 0; O(1 + 0) = 1 y O(12) = 1. Por ende NO SIEMPRE es más convieniente la dinámica que la estática.

Answer 16

F. Un Arbol completo de nivel N, es cuando tiene hojas tanto en el nivel N, como el N-1, y un arbol es balaceado (AVL), cuando en ambas ramas tiene la misma profundidad y dicha profundidad es N o N-1. Por ende no necesariamente debe tener hojas en el mismo nivel.

Answer 17

Ambos métodos son aplicables al armado de índices en las bases de datos: Mientras que hashing permite mayor velocidad de acceso directo, árbol B entrega mejor performance a la hora de realizar accesos secuenciales. Ambos permiten claves duplicadas, pero solo árbol B acepta una clave que no sea completa. Mientras que árbol B desperdicia mucho espacio en nodos y punteros, hashing solamente necesita al menos una tabla de índices. -- El Hashing tiene como ventaja el acceso rápido a una clave específica, a diferencia del arbol B que tiene como ventaja el acceso secuenciald e claves. El Hashing se encuentra en memoria principal, mientras que el B tree puede estar en memoria secundaria El Hashing tiene la desventaja de que se pueden producir colisiones, teniendo que generar una función de rehash, mientras que el arbol B no tiene colisiones (puede soportar duplicados), pero tiene un costo computacional muy alto cuando se llenan los nodos, teniendo que splitear todos los nodos dado que todos se encuentran en el mismo nivel.

Answer 18

Verdadera, Un árbol-B se mantiene balanceado porque requiere que todos los nodos hoja se encuentren a la misma altura.

Answer 19

F. El árbol B+ es una estructura que guarda los datos en las hojas y es muy utilizado por los motores de base de datos para la creación de índices. Entonces al basarse en un árbol balanceado donde los datos se encuentran en el mismo nivel, la consulta por clave puntual es más performante.

Answer 20

- El Quicksort es más sencillo y tiene menos líneas de codigo que el Heapsort aunque tiene un orden de complejidad más alto. - El Heapsort generalmente es más rápido que el Quicksort, aunque no en todos los casos. - El Quicksort puede llegar a ejecutarse menos veces que el Heapsort en el mejor de los casos.

Answer 21

F, justamente tambien se lo llama procedimiento recursivo, asi que si puede ser recursivo.

Answer 22

V. El algoritmo quicksort en el mayor de los casos tiene un orden de complejidad de n log N. Esto se da cuando el valor de pivote elegido se encuentra en el centro de la lista. En el peor de los casos el órden de complejidad es n2 y se da cuando el valor del pivote se encuentra en alguno de los extremos o cuando la lista está casi ordenada.

Answer 23

F. En el peor de los casos, QuickSort tiene una complejidad computacional de O(n2), mientras que heapsort mantiene siempre su misma complejidad computacional que es O(n log n).

Answer 24

F. El Heapsort es más rápido que QuickSort en todos los casos, dado que en el peor de los casos HeapSort tiene una complejidad computacional de O(n log n), mientras que QuickSort tiene una complejidad computacional de O(n2).

Answer 25

V. Siempre es O(n log n) para el mejor caso, el peor caso, y el caso promedio.

Answer 26

F. En el peor de los casos, el Quicksort tiene una complejidad computacional de O(N2), y en el mejor de los casos y el promedio tiene una complejidad computacional de O(n log n), igual que en todos los casos de HeapSort.

Answer 27

F. Ante cualquier cualquier caso, Heapsort tiene una complejidad computacional de O(n log n), y el peor rendimiento para el peor caso lo tiene QuickSort, que tiene una complejidad computacional de O(n2).

Answer 28

F. Si tiende a ordenado, sería el peor de los casos, y su complejidad computacional tiende a O(n2), siendo el peor de los casos.

Answer 29

V. El orden de complejidad de un ABB es en promedio O(log n), mientras que el promedio del Quicksort es de O(n log n), en los peores casos, el ABB tiene un orden de complejidad O(n), mientras que el QuickSort es de O(n2).

Answer 30

V. QuickSort tiene como mejor caso y caso promedio, un O(n logn), pero en el peor de los casos tiene un O(n2), a diferencia del HeapSort y MergeSort que en todos sus casos tiene un O(n logn).

Answer 31

F. Depende de la frecuencia de uso de los caracteres en cuestión. Puede pasar que el árbol no quede completo al haber pocos caracteres con mucha frecuencia y muchos con frecuencia mínima.

Answer 32

V. Se basa en un arbol binario que consigue los códigos comprimidos para cada caracter según la frecuencia de uso de cada uno.

Answer 33

V. Dado que la fórmula para saber la cantidad de nodos es: (hojas * 2) -1, esto SIEMPRE va a dar un número impar.

Answer 34

V. Dado que el árbol de Huffman va tomando 2 caracteres de menor frecuencia y los une por medio de un nodo auxiliar, y así recursivamente, se llega a que la fórmula de expresión para saber la cantidad total de nodos es: hojas * 2 - 1.

Answer 35

F. Depende de la frecuencia de ocurrencia de uso de los caracteres.

Answer 36

F. No necesariamente tiene que estar balanceado el árbol. Eso depende de la frecuencia que aparezca el caracter.

Answer 37

Las estructuras son 4, tenes la tabla de frecuencias que siempre arranca en 1 y una vez que pasas a la frecuencia siguiente vas a pasar el puntero abajo de todo devuelta, despues tenes el arbol binario que lo armas desde las hojas hasta la raiz teniendo en cuenta que todos los caracteres son hojas. Para saber si es 0 o 1, el arco del hijo izquierdo es 0 y el arco del hijo derecho es 1. Ahora la estructura que sigue es la pila, porque vos metes los 0 y 1 desde la hoja hasta la raiz, cuando siga despues de la raiz va a venir un caracter porque todos los caracteres son hojas, entonces va a cortar y sabe que hasta la raiz es el codigo del caracter anterior. Y despues para leerlo haces LIFO, lo lees desde la raiz hasta la hoja y ese es el codigo del caracter. Y despues la ultima estructura es la del archivo original y archivo comprimido, vos vas a poner todos los codigos de caracteres uno al lado del otro y los concatenas formando de 8 bits para obtener que caracter en ASCII es.

Answer 38

Si el puntero ledge no es nulo, quiere decir que a ese nodo le esta entrando un arco, es falso porque en los minimales solo salen arcos, no le entra ninguno.

Answer 39

V. El puntero “LLINK” en la implementación de Pfaltz se encuentra en la estructura de arcos y contiene la dirección del primer elemento de una listas de arcos con el mismo “RPOINT”, es decir, aquellos arcos que llegan al mismo nodo que al que está analizando. Los nodos en los árboles tienen un solo camino desde la raíz hasta el mismo par lo que ese campo estaría vacío.

Answer 40

Serían dos listas, una para nodos y una para arcos. La de nodos tiene: ID, Funciones, LEDGE, REDGE, y NEXT (puntero al próximo). Y la de arcos tiene: ID, Funciones, RLink, LLink, RPoint, LPoint y NEXT (puntero al próximo).

Answer 41

Falso. (El valor para el cual se usa el or exclusivo no tiene nada que ver con la posición del FRONT).

Answer 42

V. La función de dobles separa el número?? de dos mitades, las convierte a binario y luego las suma con or exclusivo y eso lo pasa a decimal de nuevo. En este caso, ambas partes serían 73 en binario, por lo que el sumarles? Cada par de dígitos va a dar uno por ser iguales. El cero en binario también es cero en decimal, por lo que el resultado final será cero. (tabla de verdad de or exclusivo).

Answer 43

F. El método de Hashing resuelve eficientemente las búsquedas directas, y el Árbol B resuelve las secuenciales y por rangos.

Answer 44

F. La cantidad de entradas en una tabla de hash es estática por definición.

Answer 45

V. Para la búsqueda de claves específicas, Hashing es más performante. Para la búsqueda de claves secuenciales, árbol B es más performante.

Answer 46

F. Hashing es más óptima para la busqueda de valores directos, en cambio los de Arbol B es más óptima para la búsqueda de valores por rangos.

Answer 47

F. Para la creación del INDEX, no siempre se da el caso de que es más rápido. Depende los campos utilizados y los tamaños.

Answer 48

F. El método de hashing es performante para el acceso directo a las claves, y justamente tiene problemas por no soportar claves duplicadas, donde hay métodos para manejar dichas “colisiones”. En cambio, y escrito por Reinosa, “El árbol B puede administrar claves duplicadas si las hay, está una debajo de la otra en la hoja que les corresponde apuntando cada una de ellas a la componente de datos correspondiente.”

Answer 49

1. Datos: Los datos pueden ser integrados (minimiza la redundancia) o compartidos (pueden ser accedidos de forma concurrente). 2. Programas – Procesos: El DBMS es el programa más importante, los procesos controlan las actividades del DBMS y abstraen al usuario de los detalles a nivel de HW. 3. Usuarios: Hacen referencia a los programadores de la aplicación, al DBA (Administrador de BD), a los usuarios finales y a otros grupos funcionales. 4. Tecnología: Hacen referencia al Hardware (Memoria) y el Software (Sistema operativo).

Answer 50

F, La integridad de los datos pueden ser por entidad o referencial, y los mismos se pueden dar por definiciones de dominio como son las contraint de primary key, foreign key, y las de UNIQUE.

Answer 51

Las constraints se basan en tres tipos de integridades: -integridad de entidad: es usada para asegurar que los datos pertenecientes a una misma tabla tienen una unica manera de identificarse, es decir que cada fila tenga una PK capaz de identificar univocamente una fila y esa no puede ser nula. -integridad referencial: es usada para asegurar la coherencia entre datos de dos tablas, aca se hace referencia a la FK. Ademas las constraints referenciales permiten a los usuarios especificar claves primarias y foraneas para asegurar una relacion padre hijo. Hay tres tipos de constraints referenciales: ciclic referencial constraint, self referencing constraint y multiple path constraint. -integridad semantica: es la que nos asegura que los datos que vamos a almacenar tengan una apropiada configuracion y que respeten las restricciones definidas sobre los dominios o sobre los atributos. Son data type, default, unique, not null y check.

Answer 52

Las BD no relacionales no cumplen con consistencia.

Answer 53

Backup es copiar total o parcialmente la información de una BD y almacenarla en otro sistema de almacenamiento masivo. Los tipos de backups son 1. Backup completo o full: Se guarda toda la información que se actualizó. 2. Backup incremental diferencial: Se guarda la información que se actualizo a partir de una fecha tomando como punto de partida (delta T) la fecha del ultimo backup incremental. 3. Backup incremental acumulativo: Se guarda la información que se actualizo a partir de una fecha tomando como punto de partida (delta T) la fecha del ultimo backup full. 4. Backup en caliente: Se realiza cuando la aplicación está funcionando. 5. Backup en frio: Se realiza cuando la aplicación no esta en uso. 6. Backup de logs transaccionales: Se realiza sobre logs transaccionales.

Answer 54

* READ UNCOMMITED: minimiza el overhead ya que no genera bloqueos. En contrapartida puede generar Lecturas sucias, lectura no repetibles, y lecturas fantasmas. * READ COMMITED: Es la opción por defecto de SQL. Una operación de lectura establece un bloqueo compartido sobre los datos que se están leyendo, pero se desbloquea al cuando finaliza dicha operación (SELECT). Evitando las lecturas sucias, pero con la posibilidad de generar lecturas no repetibles y lecturas. * REPEATABLE READ: La operación de lectura (SELECT) establece un bloqueo compartido hasta el final de la transacción (COMMIT), para poder garantizar que no se produzcan lecturas no repetibles. Si bien tampoco genera lecturas sucias, podría generar lecturas. * SERIALIZABLE: Bloquea la inserción y lectura en todos los valores del rango propuesto en el WHERE para poder así evitar lecturas fantasmas. De más está decir que evita lecturas no repetibles y lecturas sucias.

Answer 55

Los índices son una estructura asociada a una tabla en una base de datos con el fin de mejorar la performance de la misma. Son independientes de la información física. Estos pueden llegar a ser basados en la técnica de hashing o en árboles B. Cada uno tiene sus ventajas y desventajas, principalmente en el acceso a datos. Mientras que hashing es mejor para el acceso directo, árbol B es mejor para el acceso secuencial.

Answer 56

La gran ventaja de los índices es que te permite acceder a los datos de forma más rápida, mejorando la performance de las consultas. La gran desventaja es que necesitas de espacio adicional para almacenar y mantener las estructuras que se crean para los índices. Tienen un costo ocupacional y computacional muy alto, dado que al hacer inserts, deletes, o updates, generan que se recalculen los índices.

Answer 57

Sirven para mejorar la performance de las consultas donde hay JOINs, WHEREs, y ORDER BY.

Answer 58

B tree index B tree cluster index Reverse key index Bitmap index

Answer 59

Los índices pueden ser: - UNIQUE (únicos) - CLUSTER (Los datos se ordenan físicamente igual que el índice). - DUPLICADOS (Dos índices para un mismo campo). - COMPUESTOS (Un índice compuesto entre 2 o más campos).

Answer 60

F. También sirven para asegurar unicidad para las filas almacenadas.

Answer 61

``` El objetivo de los índices es acceder de forma más rápida a los datos almacenados en las tablas. Son estructuras opcionales asociadas a estas que son independientes física y lógicamente de los datos almacenados. Se pueden crear distintos tipo de índices sobre uno o más campos. Los tipos de índices son los siguientes: B-Tree index B-Tree clustered index Bitmap index (oracle) Hash index (mysql) Functional index/function based index Reverse key index La estructura de Árbol-B es la más utilizada por los motores de bases de datos para la creación de los índices. La variante que usa cluster ordena los índices, por lo que al entrar de forma contigua son accedidas de forma más eficiente. ```

Answer 62

Una vista (VIEW) es un objeto de DB el cual es utilizado para encapsular una consulta a una o más tablas, pudiendo cambiar la forma de representar los datos para quien consume la vista. Internamente no guarda los datos de la vista, sino que hace la consulta a las tablas. Sirven para facilitar el acceso de ciertas consultas complejas a las aplicaciones para que éstas aprovechen mejor la forma en que se muestran los datos. También generan mayor seguridad dado que no se muestra la tabla cómo realmente es.

Answer 63

Una view es un conjunto de columnas, ya sea reales o virtuales, de una misma tabla o no, con algún filtro determinado o no. De esta forma, es una presentación adaptada de los datos contenidos en una o más tablas, o en otras vistas. Una vista toma la salida resultante de una consulta y la trata como una tabla. Se pueden usar vistas en la mayoría de las situaciones en las que se pueden usar tablas. Caracteristicas: - tiene nombre especifico -No aloca espacio de almacenamiento -No contiene datos almacenados. -Está definida por una consulta que consulta datos de una o varias tablas. Las vistas se pueden utilizar para: •Suministrar un nivel adicional de seguridad restringiendo el acceso a un conjunto predeterminado de filas o columnas de una tabla. •Ocultar la complejidad de los datos. •Simplificar sentencias al usuario. •Presentar los datos desde una perspectiva diferente a la de la tabla base. •Aislar a las aplicaciones de los cambios en la tabla base. También y con respecto a la seguridad estaria bueno mencionar el uso del with check option ya que con esto se puede actualizar siempre y cuando el checkeo de la opción en el where sea verdadero.

Answer 64

Una tabla temporal es una tabla creada cuyos datos son de existencia temporal. No son registradas en las tablas de diccionario de datos. No es posible alterarlas, si eliminarlas y crear los indices temporales que necesite una aplicacion. Las actualizaciones a una tabla temporal podrian no generar ningun log transaccional si asi se configurara. Un ejemplo en donde te conviene usarlas es como almacenamiento intermedio de consultas muy grandes ya que si usas tablas temporales podes crear tablas con resultados intermedios basados en consultas de menor tamaño en lugar de intentar ejecutar una consulta unica que sea demasiado grande y multiples joins.

Answer 65

V. Porque el algoritmo de Siklossy se basa en el or exclusivo por lo mismo no podrá repetirse el valor.

Answer 66

F. Depende de que método se use para reducir las colisiones. Podría ser rehashing, chaining o separate chaining (hashing into buckets).

Answer 67

A diferencia del árbol B, el Árbol B+ tiene arcos entre sus hojas lo cuál facilita las busquedas por rangos. El árbol B empieza su recorrido en la raíz y va hasta una hoja, luego vuelve a la raiz y va a la siguiente hoja, lo cual lo hace altamente performante para busquedas por rangos. En cambio, el árbol B+ no necesita volver a la raiz si no que cuando llega a la primer hoja del rango simplemente avanza hacia sus hermanos.

Answer 68

``` Según el modelo ANSI/SPARC nuestra base de datos está dividida en tres niveles: Nivel Interno (Fisico): Se ocupa de la implementación fisica de los datos. Se especifican las estructuras de datos, se definen índices y métodos de acceso, etc. Nivel Conceptual (Lógico): Es el nivel intermedio que interactua entre el nivel interno y el externo. Es el encargado de agurpar todas las vistas en una sola. Tambien es la representación abstracta de la DB ya que tiene estructuras orientadas al usuario (archivo, campo, registro). Se define mediante un esquema conceptual que se escriba en DDL. Contiene definiciones del contendio de la DB, tipos de datos, restricciones Nivel Externo (vistas): Se ocupa de la forma en que los usuarios recibiran la información. Esto se puede dar por medio de distintos lenguajes, entre ellos el PL/SQL, y los usuarios finales acceden por medio de alguna interfaz. ```

Answer 69

, ya que posee un puntero en cada nodo para “pasar” de un nodo “hermano” sin necesidad de regresar al nodo padre previamente, como es el caso de árbol B.

Answer 70

El “clustering” es la probabilidad que se distribuya uniformemente las claves.

Answer 71

V, ya que la T. de Khuth es un árbol binario.

Answer 72

F. El método de dobles es solo un método para implementar una función de hashing. Esta consiste en dividir a clave en dos partes, cada una transformarlas en binario, realizar la operación de OR exclusivo entre ellas y el resultado en decimal será el cubíndice de la tabla donde se encontrará la dirección que apunta a los datos. El problema de colisiones se puede resolver con rehashing (solución final o hashing doble) o con chaining o encadenado (hashing into buckets).

Answer 73

F, con un trigger también se puede.

Answer 74

Un Store procedure es objeto de DB, que consta de un conjunto de operaciones el cual puede tener parámetros, y genera modificación de los datos (tiene efecto de lado) sin retornar información alguna. Una funcion es un conjunto de operaciones el cual puede tener parámetros, que no tiene efecto de lado, solo retorna valores. Se pueden llamar en Contraints o Consultas Un Trigger es un objeto de DB el cual se attacha a un evento y ejecuta operaciones o procedimientos. Tiene efecto de lado, o sea que puede modificar los datos de la DB y no devuelve valores.

Answer 75

Una DB operacional está normalizada, es relativamente más pequeña que un DW, es volátil dado que la información cambia todo el tiempo. El tiempo de consulta es relativamente menor que en los DW. La información tiende a estar organizada para el uso de aplicaciones.

Answer 76

El motor de DB dispone de objetos de base de datos como son los TRIGGERS y las Vistas. Los triggers son utilizados para hacer logs de auditoria, o chequeos de permisos. Las vistas se usan para encapsular consultas de una o varias tablas joineadas escondiendo la implementación real de cada una y de esta forma, entre otros usos, defenderse de ataques de seguridad.

Answer 77

Recovery: Lleva la DB a un estado consistente utilizado los logs transaccionales Restore: Restaura la DB en base a los backups generados anteriormente.

Answer 78

Atomico, Consistente, Aislamiento (isolation), Durable. Atomico: los DBMS garantiza que cada transacción se efecua de manera atómica, o sea que se hacen todas las operaciones o ninguna Consistente: Se asegura que la DB va a quedar consistente luego de cada cambio en los datos, o sea que no se romperá Aislamiento (Isolation): Te asegura que en caso de haber concurrencia sobre una tabla, cada transacción va a manejar un conjunto de datos para poder efectuar sus operaciones. El nivel de aislamiento se puede configurar, y son: READ UNCOMMITED, READ COMMITED, REPEATABLE READ, SERIALIZABLE. Durable: La idea es que la información va a estar persistida, o sea que una vez que la transacción se acepto, los cambios van a quedar por más que el sistema falle.

Answer 79

F. El Hashing en la mayoria de los casos es acceso directo F(x)=y.

Answer 80

V. F(x)=y.

Answer 81

F, no es reversible ni unica en algunos casos

Answer 82

F, depende de como fue creada la vista y que campos involucra el insert.

Answer 83

F, para que este completo tiene que tener todas las hojas al mismo nivel, para balanceado puede ser <=1 la diferencia.

Answer 84

V. Un árbol binario completo de altura h ≥ 0 contiene al menos 2^h nodos y a lo sumo 2^(h+1) −1 nodos.

Answer 85

Falso, no sirve para compactara imágenes o vídeos.

Answer 86

F. Los nodos maximales son las hojas. Y en un árbol de expresión, las hojas son los operandos, no los operadores.

Answer 87

F. Porque puede tener un "hueco" y no sería completo.

Answer 88

F. De hecho El ejemplo de Arbol de Expresion del apunte de Arboles no es completo: a/b + (c-d)e

Answer 89

- No se pueden crear índices en las views. - Algunas views tienen restringido los: inserts, deletes, updates. - Aquellas que tengan joins. - No es posible adicionar a una view las cláusulas de: order by y union.

Answer 90

1. Para conocer la cantidad de pasos distintos de igual longitud hay entre dos nodos. 2. Para saber la longitud de paso mínima entre dos nodos.

Answer 91

El algoritmo de Sikloosy presenta la posibilidad de minimizar el espacio ocupado, utilizando un único campo link, sin aumentar el tiempo de acceso, mediante el or exclusivo. Para evitar el doble linkeo, Sikloosy propone almacenar en un mismo campo de dirección un valor que permita recorrer la estructura en ambos sentidos basandose en la suma del or exclusivo. Carasterística: - complejidad espacial. Recorre la lista en ambos sentidos.

Answer 92

Definición: El sort topológico es el proceso de convertir un conjunto de precedencias en una lista lineal simple, en la cuál ningún elemento posterior precede a uno anterior. Para comenzar el algoritmo, se obtienen los minimales. Al grafo resultante de la eliminación de los nodos minimales con sus respectivas relaciones, se aplica nuevamente el algoritmo de obtener los minimales Y así sucesivamente.

Answer 93

LEDGE: Puntero con la dirección de la primer celda de tipo ARCO de una lista de arcos que llegan al nodo.

Answer 94

REDGE: Puntero con la dirección de la primer celda de tipo ARCO de una lista de arcos que parten del nodo

Answer 95

LPOINT: Puntero con la dirección de la celda de tipo NODO de la cual parte el arco.

Answer 96

RPOINT: Puntero con la dirección de la celda de tipo NODO de la cual llega el arco.

Answer 97

Leftlink (puntero al padre) ID Funciones de asignación Rightlink ( puntero al primer hijo ) Next RightLink ( puntero al próximo hermano )

Answer 98

1. Insuficiente cantidad de espacio en discos | 2. Tiempos de transmisión prolongados y costos elevados.

Answer 99

Padre Frecuencia ID Hijo izq Hijo der.

Answer 100

Consiste en enlazar entre si los distintos pares de clave/puntero que colisionen entre sí, de forma tal de agruparlos. El encadenamiento puede darse en forma interna dentro de la misma tabla de hash, o también utilizando algún tipo de estructura auxiliar.

Answer 101

Este proceso, basado en el concepto de las estructuras dinámicas, permite resolver el problema de las colisiones a través de listas linkeadas que agrupan los registros cuyas claves randomizadas generan la misma dirección. Básicamente el proceso tiene como estructuras de datos una tabla principal (área base) y una lista linkeada (área overflow).

Answer 102

Un split puede producirse en el momento de dar de altas claves en un árbol B. Al momento de querer dar de alta una clave en un Nodo maximal, si el mismo se encuentra lleno, se deberá partir el nodo maximal en dos nodos maximales. Puede suceder que dicho nodo se encuentre lleno o que llegue a su % de llenado (Load factor), en dicho caso se debe realizar un split en el nodo. Es conveniente minimizar la probabilidad de ocurrencia de splits en un árbol B. Para ello se utiliza el Load Factor en la Carga Inicial del Árbol B.

Answer 103

El load factor es un porcentaje de carga de los nodos del Árbol B, el cual se aplica sólo en el proceso de carga inicial del Árbol B. El Load factor puede variar dependiendo de las claves a insertar o del tipo de archivo o tabla asociada a dicho Árbol B.

Answer 104

Tiempo de procesador utilizado.

Answer 105

Es un árbol n-ario.

Answer 106

Se da cuando al aplicar una función hash da como resultado una posición del vector ocupado.

Answer 107

El MergeSort es un algoritmo que se basa en la premisa “divide y venceras”, lo que es es dividir el array de valores en dos, de forma recursiva, hasta que los elementos queden en un array solos. Luego los va comparando a los grupos que fueron dividiendo, y va ordendandolos subiendo por cada array superior que habia divido anteriormente. Cuando se llegue al array principal, se obtendrá ordenado El Heapsort se basa en los monticulos binarios, lo que hace es generar un arbol binario y luego va recorriendo cada una de los subarboles hasta el arbol principal, verificando que la raiz sea mayor que las hojas, Cuando se obtiene el mayor valor en la raiz principal, se saca dicho valor y se coloca ultimo en el array de ordenados. En dicha raiz que se saco el valor se coloca la última hoja del arbol y se repite el procedimiento El Quicksort consta de un pivote y dos punteros, uno izquierdo que se recorre hacia la derecha, y otro derecho que se recorre hacia la izquierda. Se compara el pivote con el array derecho hasta que este valor sea menor que el valor al cual apunta el ptr derecho, en ese momento se intercambia y luego pasa a moverse el puntero izquierdo de la misma forma hasta que el valor sea mayor que el pivote. Cuando los dos punteros apuntan al mismo lugar significa que todo los valores a la derecha están ordenado. Se repite el procedimiento tomando otro pivote (siempre entre los punteros), por ahora el puntero derecho va a estar en el valor que termino apuntando anteriormente.

Answer 108

DW es un almacén de información proveniente tanto de sistemas internos o externos con la información desnormalizada. La idea es explotar dicha info por medio del datamining, para obtener indicadores que luego se utilizarán para la toma de deciciones. El DW esta orientado a sujetos, es variante en el tiempo, no es volatil, y es simple de usar. Hay tres modelos de construccion, que son el MOLAP (multidimensional), ROLAP (relacional), HOLAP (Hibrido). La idea del Datawarehouse es tener una carga de datos, y hacer consultas, por lo que hace que sea más simple, pero el volumen de datos, al estar desnormalizado, genera un costo ocupacional muy grande, aunque un costo de procesamiento menor. De todos modos las consultas son mucho más lentas que en una DB operacional debido al volumen de datos que maneja..

Answer 109

Dos alogritmos de ordenamiento pueden ser el heapsort y el quicksort. y dos métodos de clasificación son la clasificación externa y la clasificación interna El Heapsort es un algoritmo de ordenamiento donde se va llevando a las raices el mayor valor entre sus hijos, aprovechando los monitculos binarios. Haciendo esto desde abajo hacia arriba, se va a obtener el mayor valor en la raiz, el cual podremos quitarlo y ponerlo en el array ordenado. En reemplazo de este valor quitado anteriormente, se pondrá el último nodo del árbol en la raiz. Se repite el mismo proceso de busqueda de mayores entre raices y sus hijos hasta completar el array ordenado. Tiene una complejidad computacional de O(n log n) para el mejor caso, para el caso promedio y para el peor caso En el quicksort se toma un pivote, y se tienen dos punteros, uno izquierdo, que recorre de izquierda a derecha el array, y uno derecho que recorre de derecha a izquierda el array. Se compara el pivote con el ptr derecho, y en caso de ser menor o igual, se intercambian, y se mueve el ptr derecho una posicion, empezando a mover el ptr izquierdo. Se compara el ptr izquierdo con el pivote y se va moviendo de a una posicion hasta encontrar un valor que sea mayor, donde se intercambia con el ptr derecho, y ahora se pasa a mover el ptr derecho. Así hasta que se junten los ptr, donde se intercambia el piviote seleccionado por dicha posicion. En el Mejor de los casos, y en el caso promedio, su complejidad computacional es de O(n log n), pero en el peor de los casos es O(n2). De todos modos es el caso más eficiente para la mayoria de los casos. Clasificación Interna se refiere a que el archivo a ordenar esta complemente en memoria, por lo que se puede acceder a la información de forma facil y aleatorea. Clasificación externa se refiere a que el archivo a ordenar se encuentra en un disco de almacenamiento, por lo que genera el acceso a los datos de forma secuencial.

Answer 110

Un área de stage (se puede traducir como área de pruebas o área de ensayo), también llamada zona de landing (zona de aterrizaje), es un área intermedia de almacenamiento de datos utilizada para el procesamiento de los mismos durante procesos de extracción, transformación y carga (ETL). Esta área se encuentra entre la fuente de los datos y su destino, que a menudo son almacenes de datos, data marts u otros repositorios de datos. Las zonas stage pueden proporcionar beneficios diversos, pero la principal motivación para su uso es aumentar la eficiencia de los procesos ETL, garantizar la integridad de los datos y apoyar ciertas operaciones que aseguren la calidad de los mismos.

Answer 111

F, Si esta implementada en una DB Multidimencional se llama MOLAP, pero también se puede implementar en DB relacionales que se llaman ROLAP, o hacer casos híbridos que se llaman HOLAP.

Answer 112

F. Únicamente una sola fila va a aceptar NULL en el campo que tiene aplicado dicha contraint.

Answer 113

F. Las claves candidatas son posibles claves primarias, pero cuando no son primarias, se llaman alternas o alternativas.

Answer 114

V. Como tiene la contraint UNIQUE, sólo puede tener UNA fila con el valor NULL en el campo que se aplicó dicha restricción.

Answer 115

V. NULL es el único valor NULO que puede tener toda la tabla para esa columna.

Answer 116

F. No necesariamente. Si haces un BEFORE, se va a ejecutar el trigger independientemente del resultado. al igual que el AFTER.

Answer 117

F. Si no retorna filas se lo toma como un NULL, y se puede hacer alguna operación de comparación.

Answer 118

V. Si falla el trigger, tambien fallará el insert original.

Answer 119

F. Se podría asegurar la unicidad de los campos por medio de un Trigger, aunque no sería la mejor opción. De todos modos, hace que la premisa sea falsa ya que no sería la única forma.

Answer 120

F. Por el hecho de poner SELECT … 1, hace que siempre retorne UNA fila en caso de cumplirse la o las condiciones del WHERE, pero por el hecho de hacer un UNION ALL, hace que los resultados por separado de los SELECT se unan, haciendo que retorne como máximo dos filas. El DISTINCT lo que hace es filtrar los resultados repetidos de cada subconsulta, que en este caso no hace nada, pero no aplica en la UNION de las dos consultas.

Answer 121

F. La transacción no depende del resultado del trigger, sino que se ejecuta independientemente de la misma, debido al evento obtenido.

Answer 122

F. El Having se usa para hacer condiciones con funciones agregadas (por ejemplo el COUNT). Entonces, podrías hacer una consulta ya filtrada y agrupada y decir “HAVING COUNT(campo) > 10)”, por lo que devolverá TODOS los campos que cumplan dicha condición, que pueden ser más de uno, independientemente de la cantidad de columnas.

Answer 123

V. Es una opción rebuscada, pero cierta, dado que podes hacer un INSTEAD OF en el momento que se genere el evento DELETE sobre la tabla de auditoría.

Answer 124

F. El mejor objeto que se puede usar para ocultar una tabla a una aplicación es la VIEWS, dado que encapsula consultas de una o más tablas y las muestra de tal manera que la aplicación puede aprovecharlo mejor.

Answer 125

F. La primer consulta, al tener en el WHERE el OR. Hace que en caso de que se cumpla una u otra, devuelva un 1, por cada condición cumplida y por el SELECT 1. En la segunda consulta, por tener el WHERE del campo1 y el UNION con el WHERE del campo2, hace que siempre devuelva devuelva una row por cada vez que se cumple la condición de cada subconsulta y las une, generando 2 filas. Pudiendo hacer que devuelvan el mismo resultado.

Answer 126

F. No siempre. Los índices son ventajosos en las columnas que se usan para hacer JOIN, WHEREs y ORDER BY, que no necesariamente son las que tienen la constraint PRIMARY KEY.

Answer 127

V. Dado que el trigger se ejecuta ante la aparición de un evento, esto genera un overhead que no genera la constraint.

Answer 128

F. Para ejecutar un STORE PROCEDURE, es necesario hacer un EXEC, cosa que no es posible.

Answer 129

V. Por más que algunos motores de DB permite crear índices sobre las VIEWS, como el MSSQL, los indices son al modelo físico, las vistas no son físicas. Por ende la premisa es Verdadero, y no se pueden crear índices sobre las vistas.

Answer 130

F. El count sobre un campo de la tabla, cuenta los valores NO NULOS, por ende, si ponés valores nulos en el campo 2, y valores no nulos en el campo1, o viseversa, el valor del count va a cambiar.

Answer 131

Conjunto de operaciones que se ejecutan atomicamente, o sea que se hacen todas o ninguna. En caso de fallar una operacion, se hace un rollback volviendo al estado original. Un rollback se puede dar ante una falla, por ejemplo no encontrar un PK, o perdida de conectividad.

Answer 132

Un Snapshot es una vista materializada, es una estructura el cual se guarda fisicamente los valores obtenidos en las consultas, por lo que si las tablas originales modifican dichos valores o agregan o eliminan, el snapshot no va a cambiar, quedando desactualizado. Las vistas son un objeto de DB que encapsula una consulta, de una o más tablas, no quedan fisicamente guardados los datos, por lo que si actualizan la info de las tablas involucradas, las vistas estarán actualizadas.

Answer 133

Lectura sucia: Se da cuando una transacción A modifica un valor, y luego una transacción B, lee dicho valor, pero la transacción A falló, y no commiteó el valor, por ende se rollbackea, quedando la transacción B con un valor sucio. Lectura no repetible: Se da cuando una transacción A lee un valor, luego una transacción B modifica dicho valor, y la transacción A vuelve a leer el mismo valor, va a ser diferente, no se va a repetir. Lectura fantasma: Es una anomalia de la lectura no repetible. Se da cuando una transacción A lee un rango de valores y una transacción B inserta valores, la transacción A va a leer los valores insertados por B, pero si este no commitea, se va a rollbackear, por lo que la transacción A va a quedar con elementos que ya no se encuentran en la tabla .

Answer 134

Un DM es un subconjunto de un DW, donde la información se relaciona con un area de negocio. Los datos están desnormalizados para poder hacer más rápidas las consultas, lo que genera un costo ocupacional alto debido a la redundancia de datos.

Answer 135

En caso de tener consultas secuenciales por rangos, utilizaria B tree, debido a que es más óptimo para cargar, dado que mantiene un ordenamiento. En caso de tener consultas con accesos directos a los datos, utilizaría Hashing, dado que es más optimo para dicho propósito.

Answer 136

ETL: Extraer, transformar y cargar. Es el proceso por el cual los datos se extraen de sus DB originales, se transforman para poder ser cargados en la DB. Esto se da en el staging area. Staging Area: Es un lugar donde se almacenan los datos previos a los datos del datawarehose, donde se filtra la información sensible y se depura, para luego pasarla al DW.

Answer 137

``` Fact Table (Tabla de hechos): Es una tabla que representa una relación muchos a muchos y contiene un conjunto de dos o mas FK que hacen referencias a las tablas de dimensión. Es la tabla primaria orientada a obtener medidas del negocio Dimension Table (Tabla de dimensión): Restringe los criterios de selecci on de los datos de la fact table. Cada tabla contiene una PK que siver de integridad referencial con la fact table y que hace joins con la fact table. Muchas tablas de dimensión contienen atributos textuales que son la base para restringir y agrupar consultas sobre el DW. Dependiendo de cómo se organice el DW, una tabla de dimensión puede almacenar información de uno o mas atributos relacionados (Puede estar normalizado o desnormalizado dependiendo del modelo copo de nieve o star). ```

Answer 138

ACID: Dado que las transacciones son un conjunto de operaciones que se ejecutan de manera atómica, puede pasar que ambas transacciones escriban y lean concurrentemente un mismo valor. Por ende una DB debe garantizar la Atomicidad, Consistencia, Aislamiento (Isolation) y Durabilidad de sus transacciones. El Aislamiento se puede configurar, y consta de 4 niveles. Cada nivel genera más o menos bloqueos para poder manejar las lecturas sucias, lecturas no repetibles y lecturas fantasma. Los niveles de aislamiento son READ UNCOMMITED, READ COMMITED, REPEATABLE READ, SERIALIZABLE.

Answer 139

Se puede implementar por medio de los Databases Links, el cual provee el acceso a las tablas de bases de datos remotas.

Answer 140

Los motores de DB brindan índices que permiten optimizar la performance de las query que tienen JOINs, WHEREs, y ORDER BY. Tambien proveen vistas el cual se genera un plan de ejecución para la optimización de las querys.

Answer 141

Data mining es una técnica de explotación de grandes volúmenes de datos con el fin de conseguir indicadores técnicos para la toma de decisiones. Algunos algoritmos utilizados son los algoritmos genéticos, redes neuronales, arboles de desición, entre otros. Se utiliza en los Datawarehouses.

Answer 142

Una transacción es un conjunto de operaciones que se hacen de manera atómica. Esto quiere decir que se hace todas o ninguna de las operaciones. Cuando se generan transacciones concurrentes, puede pasar que ambas quieran leer y escribir un mismo dato, lo que va a generar algunos problemas conocidos como lecturas sucias, lecturas no repetibles y lecturas fantasmas. Para evitar dichos problemas, se utilizan distintos niveles de ailamiento, que pueden ser READ UNCOMMITED, READ COMMITE, REPETABLE READ y SERIALIZABLE. Cada nivel de aislamiento va a lockear (Bloquear) de diferente manera los datos a acceder según sea el caso.

Answer 143

ANSI/SPARC. Consta de 3 niveles, El nivel interno (físico), que se ocupa de la manera que se almacenan los datos físicamente, el nivel conceptual (lógico), que se ocupa que una sola vista agrupe todas siendo mediador entre la capa externa e interna, y el nivel externo(vistas), que se ocupa la forma como los usuarios individuales percibirán los datos.

Answer 144

Un Trigger es un objeto de DB, que se attacha (o ancla) a un evento de determinada tabla, el cual ejecuta ciertas operaciones (tambien puede ejecutar store procedures). Ante algun evento de tipo INSERT, UPDATE, o DELETE, puede ejecutarse el trigger de modo BEFORE (antes), AFTER(despues), FOR EACH ROW (por cada fila), INSTEAD OF (en vez de), entre otras. Se puede utilizar para hacer logs de auditorías, chequeos a nivel reglas de negocio, agregar seguridad, etc.

Answer 145

Un DBMS es transaccional cuando la información está normalizada, se hacen muchas operaciones sobre la misma, la información de la DB es relativamente pequeña y específica. Los datos son volátiles dado que cambia todo el tiempo. Se manejan cientos de transacciones diarias, etc.

Answer 146

Una transacción es un conjunto de operaciones que se ejecutan como una unidad. Deben cumplir con la siga ACID (Aislamiento, Consistencia, Isolation, Durabilidad).

Answer 147

Las vistas y los triggers son objetos de base de datos que sirven, entre otras cosas para añadir seguridad a la DB. Las vistas encapsulan consultas de una o más tablas, lo que hace que se esconda la estructura real de las tablas y hasta se le pueden cambiar los nombres, por eso en caso de ataques de seguridad (por ejemplo, SQL INJECTION), puede prevenir que se obtenga información específica de las tablas involucradas. Los triggers se attachan ante un evento y ejecutan operaciones o procedimientos cuando dicho evento ocurre. Se puede usar para seguridad dado que podes Auditar los cambios sobre una tabla o cambiar la acción proveniente de dicho evento, por ejemplo, si se hace un DELETE, podes hacer un trigger que haga un INSTEAD OF, y no haga dicho delete, solo audite que X usuario hizo un delete sobre Y tabla.

Answer 148

Consiste en la extracción de información de grandes bases de datos para la toma de decisiones ya que predicen futuras tendencias y comportamientos. Algunas técnicas aplicadas son redes neuronales, algoritmos genéticos, árboles de decisión.

Answer 149

Un Trigger es un objeto de DB que se attacha a un evento (INSERT, UPDATE, DELETE), para luego ejecutar operaciones. La forma (o el modo) en que se ejecutan dichas operaciones (y tambien ejecutar Store Procedures) ante el evento ocurrido pueden ser configuradas, entre ellas pueden ser BEFORE (que se ejecuta antes de que se haga la operacion, util para hacer algún checkeo), AFTER (que se ejecuta luego de que se haga la operación original, util para hacer log de auditoria), FOR EACH ROW(se ejecuta en cada una de las filas, util para hacer algun checkeo por cada fila), INSTEAD OF (Cambia la operación original por la que le digas, util para manejar los datos de forma distinta).

Answer 150

Un DW es un almacén de datos donde la información se encuentra desnormalizada y proviene de uno o más sistemas (internos o externos) con el fin de tomar deciciones mediante indicadores encontrados por la explotación de dichos datos (datamining). A diferencia de un DB operacional que se dedica al cambio constante de la información que maneja, el DW en general solo se insertan los datos y se le hacen consultas, en cambio la DB operacional tiene un cambio constante de los datos. El DW es conveniente que tenga la información desnormalizada para obtener consultas más velozmente, mientras que la DB operacional es conveniente la normalización de los datos. el DW maneja tiempos de consultas mucho más altas que la DB operacional. el DW, al tener la info desnormalizada, ocupa muchisimo más espacio que la DB operacional.

Answer 151

Un Trigger es una acción hookeada a un evento, que se disparará justamente cuando ocurra dicho evento. Los eventos pueden ser INSERT, UPDATE, DELETE, y ante dichas acciones se puede anclar el trigger para que trabaje de distintas formas, por ejemplo, BEFORE (antes), AFTER(después), FOR EACH ROW(por cada fila), INSTEAD OF(en vez de), y luego hacer algún conjunto de operaciones o ejecutar algún procedure. Los posibles casos de utilización de un TRIGGER (entre otros) pueden para: Logs de auditoría DELETE en cascada Seguridad en el manejo de ciertos datos Chequeos como si fueran constraints (Por ejemplo unicidad, aunque es conveniente usar constraint UNIQUE).

Answer 152

Una función es un conjunto de operaciones que aceptan parámetros de entrada y devuelve un resultado como salida. Una limitación es que no tiene efecto colateral, o sea no puede modificar la DB, solo puede consultarla. La implementaría cuando necesito hacer una operación sobre alguna consulta de una tabla o como una constraint que haga ciertas validaciones. Un procedimiento es un conjunto de operaciones que aceptan parámetros de entrada y no devuelven resultado de salida. Los procedimientos no son llamados, sino que son ejecutados y no se pueden usar en consultas o contraints. Lo utilizaría para hacer operaciones complejas sobre la DB Un Trigger es un conjunto de operaciones que se disparan al momento de que algún evento ocurra. Dicho evento puede ser un INSERT, DELETE o UPDATE. No tienen parámetros de entrada y no se devuelve un resultado. Pueden ejecutar procedimientos, por lo que puede tener efecto de lado. Lo utilizaría para hacer DELETE en casacada o logs de auditoria.

Answer 153

La integridad referencial es usada para asegurar coherencia entre los datos. Se puede implementar por medio de las constraints PRIMARY KEY y FOREIGN KEY.

Answer 154

``` DW es un almacén de datos donde la información se almacena de forma desnormalizada, pudiendo ser la misma del propio sistema o de sistemas externos. Sirve para el análisis por medio del datamining y así tomar decisiones en base a la obtención de ciertos indicadores. El DM (DataMart) es un componente específico de un DW orientado a un área específica de la empresa, pero tiene un alcance mucho más limitado por la información que maneja (es un subconjunto de DW). Generalmente son DB Multidimencional, a diferencia del DW que se usan DB relacional. ```

Answer 155

Datawarehouse es un almacén de información donde la misma se guarda de forma desnormalizada. La información proviene de distintas partes de un sistema e incluso desde sistemas externos. La idea es poder explotar la información mediante el datamining y de esta forma obtener indicadores para la toma de decisiones. Los diferentes modelos de construcción son MOLAP (multidimensional), ROLAP (relacional), HOLAP (Hibridos). Los DW son: orientados a sujetos: clientes, vendedores, actividades, etc integradas: la forma de exponer la info de sexo puede ser m o f, pero también 0 o 1, etc, variantes en el tiempo: se hacen de un histórico y no se hacen updates. Sirven a futuro simples de utilizar: Como unicamente ocurren dos operaciones, que son carga inicial y consulta, no hay mayores inconvenientes. Simples para hacer backups no volátiles: la información útil es únicamente cuando es estable. Al ser una base de datos desnormalizada, hace que se obtenga rápido acceso y se obtengan consultas velozmente, dado que no es necesario hacer joins y recalcular datos en cada acceso, pero genera un costo ocupacional muy alto debido a la redundancia de datos.

Answer 156

Un plan de ejecución es el conjuntos de pasos que el motor de base de datos va a ejecutar para llevar a cabo la consulta. La finalidad es poder optimizar la consulta para que sea lo más performante posible.

Answer 157

El objetivo de crear índices es permitir el acceso más rápido a una tabla y generar unicidad de los campos. Un ejempo sería crear un indice entre los campos customer_number, last_name, first_name lo que mejoraría la performance de los JOIN, WHERE y ORDER BY de la tabla con dichos campos involucrados.

Answer 158

Genera un árbol binario aprovechando los mónticulos binarios, y va recorriendo dicho arbol desde las hojas hasta la raiz, comparando los valores de las hojas con la raiz de cada subarbol. Si las hojas son mayores que la raiz, entonces intercambia dichos nodos. Hace esto de forma recursiva hasta obtener el mayor valor en la raiz del arbol principal, para luego sacar dicho nodo y ponerlo como último elemento del array ordenado. En reemplazo de este nodo sacado, se pone el último nodo hoja en la raiz. Se repiten estos pasos hasta obtener el array ordenado.

Answer 159

Mecanismo que ejecuta una sentencia SQL cuando algún evento ocurre. Dicho evento puede ser INSERT, UPDATE (único evento en que se puede hacer referencia a la columna), DELETE; y la acción a ejecutar puede ser un INSERT, UPDATE, DELETE, un Store Procedure o un código procedural. Los triggers se pueden ejecutar en diferentes momentos, como ser BEFORE, AFTER, INSTEAD OF, FOR EACH ROW. Un ejemplo de cuándo usarlo es para los DELETE en cascada, dado que si existen claves foraneas, dicha contraint obliga a primero eliminar las claves foraneas antes de eliminar la fila que contiene dicha clave, por ende con un trigger se puede hacer que primero elimine dicha clave foranea antes de eliminar la fila.

Answer 160

Los objetos que se usan para mantener la integridad de entidad son las restricciones PRIMARY KEY o la combinación de NOT NULL + UNIQUE o el uso de TRIGGERs. Los objetos que se usan para mantener la integridad de referencia son las restricciones FOREIGN KEY o el uso de TRIGGERs. Los objetos que se usan para mantener la integridad de semántica son las restricciones NOT NULL, DEFAULT, CHECK, UNIQUE o TRIGGERs. También se podría pensar que limitar el acceso a las tablas de la BD mediante procedimientos almacenados, podría brindar integridad de semántica.

Answer 161

Antes de ejecutar una consulta, el motor de base de datos la optimiza. El resultado de esa optimización es lo que se conoce como plan de ejecución. Las decisiones que toma el motor para optimizar incluyen: qué algoritmo de join usar, qué algoritmo de ordenamiento usar, qué algoritmo de agrupación usar o si recorrer la tabla de forma secuencial o usando índices. Todas estas decisiones mejoran la performance de la consulta. Por ejemplo, no es lo mismo utilizar un algoritmo de join especializado para tablas de tamaño pequeño que usarlo para tablas de tamaño mayor.

Answer 162

1. INNER JOIN (unión simple): devuelve todas las filas cuando hay al menos una coincidencia en AMBAS tablas. 2. LEFT JOIN: devuelve todas las filas de la tabla de la izquierda y las filas coincidentes de la tabla de la derecha. 3. RIGHT JOIN: devuelve todas las filas de la tabla derecha y las filas coincidentes de la tabla izquierda. 4. FULL JOIN: devuelve todas las filas cuando hay una coincidencia en UNA de las tablas.

Answer 163

Extract, Transform and Load («extraer, transformar y cargar») es el proceso que permite a las organizaciones mover datos desde múltiples fuentes, reformatearlos y limpiarlos, y cargarlos en otra base de datos, data mart, o data warehouse para analizar, o en otro sistema operacional para apoyar un proceso de negocio.

Answer 164

* Reglas de negocio: cada aplicación debe reflejar las restricciones que existen en el negocio dado, de modo que nunca sea posible realizar acciones no válidas. * La información puede ser manipulada por muchos programas distintos que podrán variar de acuerdo a los departamentos de la organización, los cuales tendrán distintas visiones y necesidades pero que en cualquier caso, siempre deberán respetar las reglas de negocio. * Es por lo anterior expuesto que las reglas del negocio deben estar en el motor de base de datos.

Answer 165

* Proporciona información fiable sobre los indicadores clave del funcionamiento de una organización para los sectores que toman decisiones. * A diferencia de los sistemas transaccionales, OLAP procesa información y aplica inteligencia. * Un sistema OLAP se alimenta de uno o varios OLTP que lo proveen de datos. * Todos los campos son calculados. * Se usa para tomar decisiones. * Se basa en patrones de interés. * OLTP  DTS  OLAP. El DTS se ejecuta periódicamente para generar información. * Se implementa con distintas tecnologías: MOLAP (bases de datos multidimensionales), ROLAP (bases de datos relacionales), HOLAP (bases de datos híbridas). * MOLAP: ya no se trabaja con el concepto de filas y columnas sino dimensiones. Técnicas de hipercubo (hay dispersión) y multicubo (se saltan los cubos que no contienen información). * ROLAP:

Answer 166

* Es un esquema relacional orientado a la representación de dimensiones que convergen sobre un hecho común o un valor cuantificable. * De esta forma se logra implementar en un sistema de base de datos tradicional el concepto de cubos multidimensionales. * Existe una tabla central denominada “tabla de hechos” que representa el atributo cuantificable. * Alrededor de esta tabla central se definen otras tablas ligadas a esta mediante claves foráneas, y se denominan tablas de dimensiones y son aquellas que definen cualidades del atributo representado por la tabla de hechos. * La clave primaria de la tabla de hechos será una clave compuesta por todas las claves foráneas que representan las claves primarias de cada una de las dimensiones asociadas.

Answer 167

* Dicotómico o burbuja: funciona revisando cada elemento de la lista que va a ser ordenada con el siguiente, intercambiándolos de posición si están en el orden equivocado. Es necesario revisar varias veces la lista hasta que no se necesiten más intercambios, lo cual significa que la lista está ordenada. * Quicksort: elegir un elemento de la lista a ordenar (pivote). Resituar los demás elementos de la lista a cada lado del pivote, de un lado los menores y del otro los mayores (en este momento el pivote está ordenado). Se repite el proceso de forma recursiva para las dos sublistas mientras éstas contengan más de un elemento. Una vez terminado el proceso todos los elementos estarán ordenados. Eficiencia promedio nxlog(n); en el peor de los casos n2. * Heapsort: el algoritmo consiste en almacenar todos los elementos del vector a ordenar en un montículo (heap), y luego extraer el nodo que queda como nodo raíz del montículo (cima) en sucesivas iteraciones obteniendo el conjunto ordenado. Basa su funcionamiento en una propiedad de los montículos por la cual la cima contiene siempre el menor elemento (o el mayor, según se haya definido) de todos los elementos almacenados en él.

Answer 168

Ventajas BDOO: • Simplifica la programación. • Flexibilidad: uso de sub-clases que permiten la herencia de atributos, esto permite que una BDOO puede ajustarse a usar siempre el espacio de los campos que son necesarios, eliminando el espacio desperdiciado en registros con campos que no se usan. • Manejo de datos complejos: manipula datos complejos de forma rápida y ágil. La estructura de la BDOO está dada por referencias (apuntadores lógicos) entre objetos. Desventajas BDOO: • Baja performance. • Inmadurez del mercado de BDOO. • Falta de estándares en la industria orientada a objetos.

Answer 169

* Para representar una base de datos relacional, necesitamos almacenar no sólo las relaciones mismas, sino también una cantidad de información adicional acerca de las relaciones. * El conjunto de tal información se llama diccionario de datos o metainformación. * El diccionario de datos debe contener información como: nombre de las relaciones en la base de datos; nombre de los atributos de cada relación; dominio de cada atributo; tamaño de cada relación; método de almacenamiento de cada relación; claves y otras restricciones de seguridad; nombres y definiciones de vistas. * Además debe contener información sobre los usuarios de la base de datos y los poderes que éstos tienen: nombre de los usuarios; costo del uso efectuado por cada usuario; nivel de privilegio de cada usuario. * Es de notar que el diccionario de datos no es más que una base datos acerca de la base de datos, y puede almacenarse y manejarse con los mismos métodos.

Answer 170

* Elimina la redundancia de datos. | * Mejora la performance.

Answer 171

* DataWarehouse: YA ESTÁ EXPLICADO. * DataMart: podemos entender un Data Mart como un subconjunto de los datos del Data Warehouse con el objetivo de responder a un determinado análisis, función o necesidad y con una población de usuarios específica. La diferencia entre un DataWarehouse y un DataMart es que el data mart está pensado para cubrir las necesidades de un grupo de trabajo o de un determinado departamento dentro de la organización. Es el almacén natural para los datos departamentales. En cambio, el ámbito del data warehouse es la organización en su conjunto. Al igual que en un data warehouse, los datos están estructurados en modelos de estrella o copo de nieve y un data mart puede ser dependiente o independiente de un data warehouse. Los orígenes de datos son homogéneos a diferencia del DW.

Answer 172

* De manera estática: con una matriz de adyacencia nxn (n: cantidad de nodos del grafo), en donde un 1 en una posición ij representa la existencia de una flecha del nodo i hacia el nodo j. Presenta el problema de ocupar mucho espacio para representar lo que realmente existe ya que se reserva espacio para lugares que no tienen datos. * De manera dinámica: utilizando una lista o vector de punteros donde se guardan los nodos que participan del grafo con sus correspondientes datos. Cada elemento contiene un puntero a una lista adicional que contiene “las flechas que salen” del nodo que representan. No se guarda el dato en la lista adicional, guarda los punteros a datos.

Answer 173

Hipercubos: • Se guardan todas las dimensiones en un cubo. • Cada intersección del cubo es otro cubo y así sucesivamente. • Se pueden agregar dimensiones pero es estático porque no se puede variar la dimensión del cubo. • Hay dispersión de datos porque los datos no están compactos por el hecho de que puede haber muchos datos vacíos. Multicubos: • Se genera una lista con los cubos que tienen información, es decir se saltea los cubos vacíos.

Answer 174

* El optimizador de consultas es el componente del sistema de gestión de base de datos que intenta determinar la forma más eficiente de ejecutar una consulta SQL. * Se decide cuál de los posibles planes de ejecución de una consulta dada es el más eficiente. * Los optimizadotes basados en costos asignan un costo (operaciones de E/S requeridas, CPU, etc.) a cada uno de esos planes y se elige el que tiene menor costo. * El optimizador no puede ser accedido directamente por los usuarios, sino que, una vez enviadas las consultas al servidor, pasan primero por el analizador y recién entonces llegan al optimizador. * Una consideración muy importante es el orden de los “join”.

Answer 175

* Dos lenguajes: DML y DDL. * 3 capas: externa (usuario), lógica (conceptual) e interna (física). * Disk manager (recibe peticiones del file manager y las envía al SO), file manager (decide que página contiene el registro deseado y la solicita el disk manager) y user manager (permite la interacción con el usuario). * Arquitectura cliente-servidor: las aplicaciones corren en el cliente y generan solicitudes para y reciben respuestas del servidor. El servidor realiza el procesamiento de datos y aplica las reglas de negocio establecidas. * Clustering: es la forma de agrupar la información. Hay dos formas, intra-file clustering (todas las tablas conviven con sus elementos) e inter-file clustering (se guarda cada objeto con sus relaciones).

Answer 176

Creo que es FALSO porque una implementación ROLAP tiene tabla de hechos (en el modelo de datos de estrella o copo de nieve) pero en MOLAP la información se almacena en hipercubos o multicubos y en estos modelos no se utiliza la tabla de hechos (Según tengo entendido).

Answer 177

Según el apunte las técnicas mas comúnmente usadas en Data Minig son: - Redes neuronales o artificiales - Regresión Lineal - Árboles de decisión - Algoritmos genéticos (funcionan con evolución y descarte de los individuos menos capaces de una población según un criterio (generaciones = iteraciones sobre una cadena con la población)) - Método del vecino más cercano - Reglas de inducción

Answer 178

FALSO: también pueden utilizar árboles b

Answer 179

FALSO: Dentro de los ROLAP, los que utilizan un modelo de copo de nieve las tablas de dimensión están normalizadas hasta 3FN(creo)

Answer 180

FALSE. La OLAP tiene la misma información, pero organizada de manera de agilizar las consultas de grandes cantidades de datos.

Answer 181

VERDADERO: todos los nodos HOJA aparecen en el mismo nivel (y en inserciones o eliminaciones se rebalancea para mantenerse asi).

Answer 182

FALSO, si un arbol posee los elementos de datos en cada nodo entonces es igual.

Answer 183

Es balanceado, con lo que asegura que sea menor o IGUAL. FALSO

Answer 184

F (es mejor que Hashing, conviene q sea arbol B)

Answer 185

Falso, coincido. Todas las tablas de dimensián (tablas satélites de la/las tabla/s de hecho SIEMPRE están desnormalizadas.

Answer 186

F, la redundancia las da la normalizacion. Aseguran la integridad referencial.

Answer 187

F (la unicidad de una consulta hace a la diferencia, 3 consultas consumen MAS).

Answer 188

V, permite q no haya alteraciones entre los modelos y reduce el costo de trabajo al programador, osea le simplifica la vida.

Answer 189

F. No del modelo, de alguna tabla o mix de tablas. | Aparte no es una simplificación, sino es una sección determinada.

Answer 190

* Clave Primaria: es un campo o combinación de campos que identifica de forma única a cada fila de la tabla. * Clave Foránea: identifica una columna o grupo de columnas en una tabla que se refiere a una columna o grupo de columnas en otra tabla. * Clave Candidata: son claves que podrían servir como clave primaria. * Dominio de los Datos: un dominio describe un conjunto de posibles valores para cierto atributo.

Answer 191

Dimensiones en DW: llamamos dimensiones a aquellos datos que nos permiten agrupar o filtrar información. Existe una Dimensión Table que restringe los criterios de selección de la Fact table. Cada dimensión está definida por su clave primaria que sirve como base para la integridad referencial con la fact table.

Answer 192

◦ Proporciona información fiable sobre los indicadores clave del funcionamiento de una organización para los sectores que toman decisiones. ◦ A diferencia de los sistemas transaccionales, OLAP procesa información y aplica inteligencia. ◦ Un sistema OLAP se alimenta de uno o varios OLTP que lo proveen de datos. ◦ Todos los campos son calculados. ◦ Se usa para tomar decisiones. ◦ Se basa en patrones de interés. ◦ OLTP → DTS → OLAP. El DTS se ejecuta periódicamente para generar información. ◦ Se implementa con distintas tecnologías: MOLAP (bases de datos multidimensionales), ROLAP (bases de datos relacionales), HOLAP (bases de datos híbridas). ◦ MOLAP: ya no se trabaja con el concepto de filas y columnas sino dimensiones. Técnicas de hipercubo (hay dispersión) y multicubo (se saltan los cubos que no contienen información). ◦ ROLAP

Answer 193

Es un método de fácil implementación y poco consumo de recursos. Es recursivo pero se usan versiones iterativas para mejorar su rendimiento, también es in-situ, ya que usa solo una pila auxiliar. El QuickSort está basado en la idea de divide y vencerás, en el cual un problema se soluciona dividiéndolo en dos o más subproblemas, resolviendo recursivamente cada uno de ellos para luego juntar sus soluciones para obtener la solución del original.

Answer 194

Al ocupar más espacio cada nodo del árbol supera el tamaño de una página del File System, de esta forma el Sistema Operativo debe leer varias páginas para levantar un nodo, por eso es mas lento.

Answer 195

Es mantener la integridad referencial entre tablas.

Answer 196

Sistema de Administración de Bases de Datos (DBMS): Construido sobre sus capacidades en vez de las simples funciones de recuperación y almacenamiento de datos. Estos productos comúnmente incluyen grandes capacidades de back-up y recuperación de datos, ingreso al sistema, control de concurrencia y bloqueo, y mecanismos de seguridad.

Answer 197

Costo, Volumen de datos, tiempo de respuesta, control de acceso concurrente y seguridad, redundancia y recuperación de datos.

Answer 198

OLAP: En el análisis multidimensional, los datos se presentan mediante dimensiones como producto, territorio y cliente. Por lo regular las dimensiones se relacionan en jerarquías, por ejemplo, ciudad, estado, región, país y continente, o estado, territorio y región. Al procesamiento analítico o análisis multidimensional se le conoce también como procesamiento analítico en línea (OLAP). Se procesa en una visión multidimensional de los datos empresariales en el Data Warehouse y puede tener un motor de depósito de base de datos multidimensional. De esta forma, dentro de un Data Warehouse existen dos tecnologías complementarias, una relacional para consultas y una multidimensional para análisis. Este concepto nace ante la debilidad fundamental de las bases de datos relacionales para proveer capacidad de análisis y sistemas de soporte a las decisiones. La siguiente definición muestra las mejoras que provee un Modelo Olap: Fast (Rápido), significa que el sistema está orientado a tener tiempos de respuesta de 5 segundos, con respuestas de 1 segundo a consultas sencillas y, algunas más complejas, con respuestas de hasta 30 segundos . En situaciones típicas, si las respuestas toman más tiempo, el usuario perderá la concentración en lo que busca analizar. Analysis (Análisis), lo que indica que al usuario debe proporcionársele suficiente funcionalidad para resolver sus problemas, sin la necesidad de contar con el apoyo de sistemas o de una pre-programación. De esta forma, se podrán realizar consultas no definidas, cálculos de diferencias, variaciones y tendencias, consolidar y llevar a cabo análisis de sensibilidad y de búsqueda de metas. Shared (Compartida), significa que debe haber facilidad de acceso simultáneo, tanto de lectura como de escritura, aunado a un esquema de seguridad adecuado, con el objeto de guardar la confidencialidad (probablemente a nivel de celda). Multidimensional, ha sido y continuará siendo un requisito, con la habilidad de manejar múltiples jerarquías y dimensiones. Information (Información), son todos los datos y la información derivada, cuando y donde sea necesaria, en su contexto, tanto de información “suave” como información “dura”, interna o externa.

Answer 199

Son herramientas y objetos que permiten mover datos entre varios orígenes de datos diferentes o iguales. Un DTS puede realizar las siguientes tareas: - Importación y exportación de datos entre dos orígenes de datos. - Transformación de datos. - Copia de objetos de base de datos : tablas, índices, etc. - Ejecución de instrucciones de Transact-SQL. DTS tiene una arquitectura OLE DB por lo que puede copiar y transformar múltiples orígenes de datos, entre ellos: SQL Server, Oracle.

Answer 200

``` F, el siguiente ABB no es completo: 33 / \ 17 35 / \ \ 15 28 42 ```

Answer 201

FALSO. Usando Load Factor al 100% puede que los nodos queden llenos.

Answer 202

FALSO. Dicho grafo no es un árbol, ya que para que sea árbol la suma de los nodos debe ser igual a la suma de arcos más uno.

Answer 203

VERDADERO. Read commited lee las filas y libera el lockeo.

Answer 204

Contraejemplo: O / | \ O O O

Answer 205

FALSO. Un árbol de dos nodos puede solo tener un arco, por lo cual es de grado uno.

Answer 206

VERDADERO. ambas son restricciones, la PK de unicidad y la FK de restricción referencial.

Answer 207

FALSO. Existen restricciones a nivel de data type. Validaciones a nivel de campo, por ej, constraint de dominio.

Answer 208

FALSO. A diferencia de otros algoritmos de compactación (jpeg, divx, mp3), Huffman no genera pérdida de información.

Answer 209

FALSO. La función de grupo puede ser aplicada a todo el set de datos que devuelve el select.

Answer 210

VERDADERO, justamente está describiendo el objetivo de una tabla de hash.

Answer 211

FALSO. Una función no permite hacer modificaciones a los datos, solamente consultarlos. Esa es una de las diferencias entre los SP y las funciones.

Answer 212

VERDADERO. Data Mining, la extracción de información oculta y predecible de grandes bases de datos, es una poderosa tecnología nueva con gran potencial para ayudar a las compañías a concentrarse en la información más importante de sus Bases de Información (Data Warehouse).

Answer 213

FALSO. En el peor de los casos, el camino de búsqueda termina en el nodo de la hoja más profunda, por lo tanto el tiempo de ejecución en el peor de los casos esta determinada por la altura del árbol-B.

Answer 214

FALSO. Si ya que están totalmente renormalizadas pero pierde el modelo de STAR.

Answer 215

VERDADERO. Ya que cuenta las repeticiones de cada carácter.

Answer 216

VERDADERO. Le da un tratamiento totalmente diferente a los datos y tiene a su vez orientaciones totalmente diferentes un OLAP está orientado al análisis empresarial, en cambio OLTP esta restringido a tareas específicas. Por lo tanto los resultados no serán los mismos.

Answer 217

FALSO. Desde el lado del resultado es el mismo, pero por otro lado la Vista guarda el “programa de ejecución” de la consulta, lo cual la hace más rápida a la hora de ejecutarce.

Preguntas Parcial Y Final Flashcards

La cursada fue hecha con Moscuzza (258 cards)