2. Estructuras de dispositivos masivos de datos Flashcards

(20 cards)

1
Q

Que es el almacenamiento masivo?

A

El almacenamiento masivo se refiere a los dispositivos de almacenamiento no volatil que conservan la información aunque se corte la corriente. Incluye principalmente: Discos y Cintas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Como funcionan los discos?

A

Los discos son dispositivos de almacenamiento masivos, pueden ser:
* electromagneticos: HHD
* optomagneticos: CD-ROM y DVD
* estado solido: SSD

Se acceden a nivel de bloques por el sistema de archivos.

Se conectan al bus E/S interno (SCI, SATA) o externo (USB, thunderbolt). Bah… se conectan el controlador del equipo y la controladora del disco.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Como es la estructura interna de un disco duro (HDD)?

A

Consta de los siguientes componentes:
* Platter: discos donde se almacenan los datos magnéticamente.
* Spindle: eje que hace girar los platos.
* Track: anillos concéntricos sobre el plato.
* Sector: fragmentos de una pista; unidad mínima de datos.
* Cylinder: conjunto de pistas alineadas en todos los platos.
* Arm assembly: estructura que mueve las cabezas.
* Arm: sostiene la cabeza de lectura/escritura.
* Read-write head: lee y escribe datos sobre los platos.
* Rotation: indica el giro constante de los platos.

Funcionamiento:
1. Los platos giran constantemente a alta velocidad gracias al spindle
2. El brazo mueve las cabezas hacia la pista correcta en el plato
3. La cabeza lee o escribe datos en los sectores mienstras los platos giran debajo de ella.
4. El movimiento combinado permite acceder a cualquier dato en el disco.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Como funcionan las cintas?

A
  • Almacena una gran cantidad de datos de forma relativamente permanente.
  • el tiempo de acceso es lento: la velocidad de acceso aleatoreo es 1000 veces mas lentos que el disco
  • se usa para back up
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Como se conectan los dispositivos de almacenamiento masivo al sistema?

A

Los dispositivos de almacenamiento pueden conectarse a las computadoras de distintas formas:

Conexión Directa (DAS - Direct Attached Storage)
* Los discos estan conectados directamente al servidor, por buses locales como: SATA, SCI, USB.

SAN (Storage Area Network)
* Los discos estan en una red especial (separada de la LAN), y los servidores acceden a ellos como si fueran discos locales, a nivel de bloques

NAS (Network Attached Storage)
* Los discos estan en un servidor conectado a la red (LAN) u se accede a los archivos a traves de la red.
* proporciona acceso a nivel de bloque
* se usa en grandes centros de datos, donde se necesita rendimiento y alta disponibilidad
* se implementa a traves de RPC entre host y storage
* Protocolo iSCSI usa el protocolo TCP o UDP sobre una red IP para transportar el protocolo SCSI

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Que es la planificación de disco?

A

El sistema operativo es responsable de usar el hardware de forma eficiente, Desde la perspectiva del disco, esto significa obtener un rapido acceso a los datos y aprovechar al maximo el ancho de banda al disco.

El planificador de disco es uno de los componentes mas importantes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Cual es el objetivo de la planificación de disco?

A

La planificación de disco busca minimizar:
* Tiempo de posicionamiento (seek time): tiempo que el brazo del disco necesita para posicionar la cabeza en el cilindro que contiene el sector.
* Latencia de rotación (rotational latency): tiempo que demora rotar el plato al sector correcto

Tiempo de acceso =
Tiempo de posicionamiento
+ Tiempo de rotacion
+ Tiempo de transferencia

El ancho de banda (bandwidth) de un disco es la cantidad de bytes transferidos, dividido por tiempo total de transferncia, desde le cominzo del pedido hasta la ultima transferencia.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Cuales son los metodos de planificación de disco?

A

Para mejorar el acceso a los datos se debe minimizar el
tiempo de búsqueda. De esa forma, surgen varios
métodos de planificación de disco:
* FCFS (First Come First Served): atiende las solicitudes en el orden en que llegan
* SSTF (Shortest Seek Time First): atiende la solicitud más cercana a la posición actual. puede generar posposcion indefinida.
* SCAN: la cabeza se mueve de un extremo al otro atendiendo solicitudes, ida y vuelta (como un ascensor). se acumulan pedidos del lado mas lejano
* C-SCAN: la cabeza recorre en una dirección y vuelve rápido al inicio sin atender solicitudes en el regreso. recorre todo sin necesidad.
* LOOK : similar a SCAN, pero solo va hasta la última solicitud pendiente antes de invertir el sentido
* C-LOOK: similar a C-SCAN, pero solo recorre hasta la última solicitud y luego vuelve al inicio.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Como es la planificación en discos SSD?

A
  • Los algoritmos anteriores no aplican para discos SSD dado que no tienen partes móviles
  • En general un algoritmo FCFS es suficiente para discos SSD (uniendo las escrituras contiguas en el mismo sector)
  • Los sectores de los discos SSD no se pueden sobreescribir, hay que borrarlos primero y el borrado es la operación más lenta
  • Al sobreescribir un bloque muchas veces se marca al original como inválido y se escribe uno nuevo
  • Cuando no hay espacio libre hay que hacer garbage collection y borrar los bloques con datos inválidos
  • Para optimizar esto es útil que el filesystem le indique al disco cuando hay sectores que se borraron (solo se marcaron como libres en el sistema pero no se borraron)
  • Esta operación es conocida como TRIM y permite que el disco libere más bloques en el garbage collection.
  • Esta operación se realiza en general cuando el disco no tiene actividad para que no impacte el rendimiento.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Que y como es el manejo de disco?

A

El manejo de disco son todas las tareas que realiza el sistema operativo para preparar, organizar y controlar el uso de un disco de almacenamiento. Incluye desde su preparación inicial hasta la forma en que se leen y escriben los datos.

Dentro de la actividaddes del manejo de disco estan:
* Formateo físico (bajo nivel): Divide el disco en sectores legibles y grabables por el controlador. Crea la estructura básica para poder almacenar bits.
* Particionamiento: divide el disco en una o más áreas lógicas independientes (particiones). Cada partición puede tener su propio sistema de archivos.
* Formateo lógico (sistema de archivos): escribe las estructuras necesarias para organizar los archivos y directorios (por ejemplo, FAT, NTFS, ext4).
* Sector de arranque (MBR): se escribe un pequeño programa en el primer sector del disco (sector de boot) para iniciar el sistema operativo cuando la computadora arranca (codigo de boot).
* Gestión en tiempo de uso: el sistema operativo rastrea qué sectores están libres y cuáles ocupados, administra el espacio libre y organiza las operaciones de lectura/escritura.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Que es y como funciona el sector de boot?

A

El sector de boot es el primer sector en la partición de boot. Su cometido es almacenar un código de arranque, con las instrucciones para cargar el kernel del sistema operativo.

El proceso de boot inicia ejecutando un código residente en ROM, que lee el Registro Maestro de Boot, lo carga en memoria, examina su tabla de particiones y determina el primer sector de la partición de boot, que es el sector de boot.
Luego se cargan otros susbsistemas y servicios del kernel.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Que son las estructuras RAID?

Redundant Array of Independent Disl

A

Las tecnicas RAID son tecnologias de los sistemas de almacenamiento de disco orientadas a mejorar el servicio, mejorando:

confiabilidad: minimizando los casos de fallo de disco
* Para esto se agrega redundancia de información
* Puede darse duplicando discos (mirror) o a traves de bits de control

performance: minimizando los tiempos de transferencia.
* se logra disponiendo la información en diferentes discos y accediendo simulataneamente
* Se usan tecnicas de striping (division por bandas)

Los RAID son 0,1,2,3,4,5,6 y combinados.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Como es RAID 0?

A
  • Stripe set
  • Dividde los datos de forma homogenea en dos o mas discos, sin información de paridad
  • no era uno de los niveles RAID originales y no proporciona redundancia de datos
  • se usa para aumentar el rendimiento, aunque tambien se pusde utilizar como una forma de crear grandes discos virtuales de un gran numero de pequeñas unidades fisicas
  • si un disco falla se pierde todo
  • si los sectores accedidos se distribuyan de forma equilibrada entre las N unidades, el acceso aleatorio será N veces mas rápido.
  • La velocidad de transferencia del sistema completo será la velocidad de transferencia de todos los discos sumados, limitado sólo por la velocidad de la controladora RAID
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Como es RAID 1?

A
  • Un RAID 1 crea una copia exacta (o espejo) de un conjunto de datos en dos o más discos.
  • Esto es útil cuando el rendimiento de lectura o la confiabilidad son más importantes que la capacidad de almacenamiento de datos.
  • Este tipo de arreglo sólo puede ser tan grande como el disco más pequeño. Un clásico RAID 1 contiene dos discos duplicados pero podrían ser más.
  • Puesto que cada miembro contiene una copia completa de los datos, que pueden tratarse de forma independiente, la fiabilidad es incrementada por la potencia del número de copias.
  • Protección eficaz contra la falla de disco físico, no contra la corrupción de datos debido a virus, cambios o eliminaciones accidentales de archivos, etc.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Como es RAID 2?

A
  • Usa codigos de correccion de errores similar al de memoria
  • ECC (Error Correcting Code): cada byte en memorai puede tener un bit de paridad. Para corregir errore necesitamos mas bits.
  • En RAID 2 la división se da a nivel de bits
  • Usa codigos de hamming para correccion de errores
  • los discos son sincronizados por la controladora para funcionar a la ve
  • No es usado por ser inaplicable en la practica.
  • Desgasta mucho los discos con los bits de redundancia
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Como es RAID 3?

A
  • Es como RAID 2 que agrega bits de correccion de erores
  • usa un disco de paridad dedicado, XOR
  • una operación de lectura o escritura necesita que todos los discos funcionen a la vez
  • se necesita un minimo de 3 discos
  • si falla un disco se puede recalcular usando los otros
  • solo funciona si falla uno
17
Q

Como es RAID 4?

A
  • funciona como RAID 3 pero usa division por bloques
  • usa un disco de paridad
  • permite lecturas en paralelo pero no puede hacer pequeñas escrituras en paralelo porque implica 2 lecturas y 2 escrituras
  • se le da mucho palo al disco dedicado
18
Q

Como es RAID 5?

A
  • Es similar a RAID 4 pero los datos de paridad son distribuidos entro todos los discos
  • Es popular debido al bago costo de redundancia.
  • Si falla un disco puede seguir funcionando
  • En el ejemplo, una solicitud de lectura para el bloque 0 sería servida por el disco 0. Una solicitud de lectura simultánea para el bloque 4 tendría que esperar, pero una solicitud de lectura del bloque 1 podría ser resuelta al mismo tiempo por el disco 1 logrando mejor tiempo de respuesta.

Manejo de Paridad
* Una serie de bloques simultáneos (uno en cada uno de los discos de una matriz) se le llama colectivamente una raya. Si otro bloque, o alguna parte del mismo, está escrito en esa misma franja, el bloque de paridad, o alguna parte del mismo, se vuelve a calcular y reescrito.
* Para las pequeñas escrituras requiere:
1. Leer el bloque de datos antiguos
2. Leer el bloque de paridad antiguo
3. Comparar el bloque de datos antiguo con la solicitud de escritura. Por cada bit que se ha invertido (cambia de 0 a 1, o de 1 a 0) en el bloque de datos, dar la vuelta el bit correspondiente en el bloque de paridad
4. Escribe el bloque de datos nuevos
5. Escribe el nuevo bloque de paridad

19
Q

Como es RAID 6?

A
  • agrega un segundo esquema de paridad al RAID 5
  • Ineficiente para pequeño número de discos
  • Tiene protección ante fallos de 2 discos
  • Puede ser más adecuado que un RAID 5 + 1 disco de reserva
20
Q

Como se combinan los RAID y para que?

A

Las combinaciones de RAID mexlan dos o mas tipos de RAID para obtener lo mejor de ambos niveles: rendimieinto o redundancia.

RAID 0+1 (o 01)
* Primero hace striping (RAID 0) para velocidad, y luego mirroring (RAID 1) para seguridad.
* Buen rendimiento y tolerancia a fallos.
* Pero si falla un disco en cada conjunto, se pierde todo.

RAID 1+0 (o 10)
* Primero hace mirroring y después striping.
* Mejor tolerancia a fallos que 0+1.
* Muy rápido y seguro.

Requiere mínimo 4 discos