Bloque2-Tema5-NoSQL Flashcards

(40 cards)

1
Q

Que significa NoSQL?

A

Not Only SQL

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Cuales son las ventajas de los sistemas NoSQL?

A

-Productividad en desarrollo (Mejor ajuste al modelo relacional)-> (Esquemas flexibles y agregacion)

-Volumen de datos (Sistemas altamente distribuidos)-> Sharding

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Cuales son las desventajas de los sistemas NoSQL?

A

-No garantizan completamente ACID (Tienen consistencia Eventual) Pero si BASE

-Falta de madurez, experiencia y compatibilidad (Aun no hay estandares)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Que es el sharding?

A

Informacion distribuida en nodos. El sharding es una técnica informática por la cual se busca dividir una base de datos o red para hacer que su funcionamiento sea mucho más escalable y descentralizado.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Que es BASE refiriendo a sistemas NoSQL?

A

Basically Available Soft State Eventually Consistent

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Que dice el Teorema CAP o de Brewer?

A

Que de la Consistencia, Availability y Partition tolerance, solo se pueden cumplir 2 a la vez.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Que es la consistencia?

A

Que todos los nodos “ven” la misma informacion.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Que es la disponibilidad (Availability)?

A

Que toda peticion tiene que recibir una respuesta.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Que es partition tolerance?

A

El sistema debe seguir funcionando aunque haya fallos en las comunicaciones que segmenten la red de nodos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Que sistemas gestores de BD cumplen CA(Consistency y Availability)

A

los Sistemas gestores de bases de datos relacionales (RDBMS)

-Oracle
-MySQL
-PostgreSQL
-SQLServer
Etc

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Que sistemas gestores de BD cumplen AP (Availability y Partition Tolerance)

A

-Riak
-Voldemort
-Cassandra
-CouchDB
-SimpleDB
-Dynamo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Que sistemas gestores de DB cumplen CP (Consistency y Partition Tolerance)

A

-HBase
-MongoDB
-Redis
-BigTable

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hablando de sistemas SQL, clasificando segun modelo informacion (Como esta organizada la informacion) Cuales estan en la columna Documentos.

A

-MongoDB
-CouchDB
-RavenDB
-TerraStore

-OrientDB*
-ArangoDB*
-DynamoDB*

*-> Multimodelo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hablando de sistemas SQL, clasificando segun modelo informacion (Como esta organizada la informacion) Cuales estan en la columna Familia Columnas

A

-Cassandra
-HBase
-HyperTable
-BigTable

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hablando de sistemas SQL, clasificando segun modelo informacion (Como esta organizada la informacion) Cuales estan en la columna Clave-Valor

A

-Redis
-Riak
-Voldemort
-ArangoDB*
-OrientDB*
-DynamoDB*
-SimpleDB

*-MultiModelo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hablando de sistemas SQL, clasificando segun modelo informacion (Como esta organizada la informacion) Cuales estan en la columna grafos

A

-Neo4j
-FlockDB
-InfinityGraph
-HyperGraphDB

-OrientDB*
-ArangoDB(*)
-AllegroGraph

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Que caracteristicas principal define al modelo clave/valor NoSQL?

A

Que cada fila no tiene un numero de columnas fijo.

18
Q

En Redis(Clave/valor), cada clave tiene asociado un tipo de datos que puede ser:

A

-Strings (GET/SET)
-sets (SADD, SMEMBERS)
-lists (LPUSH, LRANGE)
-hashes (HMSET, HGET, HGETALL)

19
Q

En que modelo NoSQL existen properties tanto en nodos como en las relaciones?

A

Modelo Basado en grafos (Ej: Neo4J)

20
Q

Nombra alguno de los algoritmos implementados por el modelo basado en grafos NoSQL

A

-PageRank(Mide la influencia transitiva o la conectividad.
-Shortest Path con Dijkstra o A*
-Euclidean distance
-Strongly Connected components con Tarjan.

21
Q

como se llama a las conexiones entre grafos en el modelo basado en grafos?

A

Relationship o Edge

22
Q

Que modelo maneja colecciones de documentos(no hace falta definir esquema) con formato JSON?

A

Modelo documento (Ej. MongoDB)

23
Q

Que sentencias CRUD conoces?

A

-db.users.InsertOne (documento-> Se genera un campo_ID)

-db.users.find

-db.users.updateOne

-db.users.deleteMany

24
Q

Que modelo es desnormalizado?

A

El modelo basado en familias de columnas (Ej: Cassandra)

Cada columna va a tener un valor y un timestamp(indica el tiempo)

25
Cuantas dimensiones tiene el modelo basado en familias de columnas? y cuales son?
4 dimensiones = [KeySpace[[ColumnFamily][RowKey][Column]
26
Que es mahout?
Apache Mahout es un proyecto de Apache Software Foundation para producir implementaciones gratuitas de algoritmos de aprendizaje automático distribuidos o escalables centrados principalmente en el álgebra lineal. Machine Learning.
27
Que aplicaciones de consultas conoces?
-Pig -Hive -Spark SQL
28
Que es Hadoop?
Sirve para programar aplicaciones distribuidas que manejen grandes volúmenes de datos.​
29
Que es MapReduce?
mapea muchos nodos y reduce o trozea la informacion. is a programming model and an associated implementation for processing and generating big data sets with a parallel, distributed algorithm on a cluster.
30
Que es Apache kafka?
Es una plataforma distribuida para la transmisión de datos
31
Que kernels administrador/gestor de cluster conoces?
-Hadoop Yarn -Apache Mesos
32
Que es HDFS?
HDFS es el sistema de ficheros distribuido de Hadoop.
33
Paradigma Batch Processing
el objetivo era acumular todos los datos que se pudieran, procesarlos y producir resultados que se «empaquetaban» por lotes. Solicitud por lotes
34
Esquema relacion de otras tecnologias con BigData
35
Que es gossip en Cassandra?
protocolo que permite a cada nodo realizar un seguimiento de la información de estado sobre los otros nodos en el clúster. peer-to-peer communication protocol
36
Como esta estructurado Cassandra?
En un anillo formado por los nodos.
37
Esquema de mongoDB.
38
Esquema de cassandra
39
Puerto de MongoDB?
27017
40
Puerto de CassandraDB?
9042