Introducción a ML Flashcards

(113 cards)

1
Q

¿Qué es Machine Learning (ML)?

A

Es una subárea de la IA que permite a las máquinas aprender automáticamente a partir de datos. Esto significa construir modelos que descubren patrones en datos históricos, y mejoran su rendimiento conforme tienen más datos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

¿Qué es aprendizaje supervisado en ML?

A

Es cuando el modelo se entrena con datos etiquetados. Aprende a predecir resultados basándose en ejemplos conocidos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

¿Qué es aprendizaje no supervisado en ML?

A

Es cuando el modelo trabaja con datos sin etiquetar y busca estructuras o agrupaciones por sí mismo.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

¿Qué es aprendizaje por refuerzo en ML?

A

Es un tipo de aprendizaje donde el sistema aprende mediante ensayo y error, recibiendo recompensas o penalizaciones según sus acciones.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

¿Por qué es importante la ética en el desarrollo de IA?

A

Porque la IA puede afectar los derechos y la vida de las personas. Es necesario que su desarrollo beneficie a la humanidad, respete la dignidad y no cause daño.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

¿Cuáles son los tres ejes éticos fundamentales de la IA mencionados?

A
  • Ética: Trato digno y equitativo sin discriminación.
  • Educación: Preparar a las nuevas generaciones para convivir con la IA.
  • Derecho: Adaptar las leyes para proteger a los más vulnerables.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

¿Qué es la IA Generativa (GenAI)?

A

Es un tipo de IA capaz de crear contenido original como texto, imágenes o música a partir de datos o instrucciones, sin copiar.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

¿Cuáles son los seis principios éticos que deben guiar el desarrollo de la IA?

A
  • Transparencia: Las decisiones de la IA deben ser explicables.
  • Justicia: Evitar sesgos y discriminación.
  • Responsabilidad: Las personas deben rendir cuentas por el uso de IA.
  • Privacidad: Protección de los datos personales.
  • Beneficencia: Promover el bienestar humano.
  • Autonomía: Las personas deben mantener el control sobre las decisiones importantes.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

¿Qué es R y cuál es su origen?

A

R es un lenguaje de programación y entorno de software estadístico de código abierto, derivado del lenguaje S de los Laboratorios Bell. Fue reconocido por la ACM en 1998 por su aporte a la estadística computacional.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

¿Qué es un objeto en R?

A

Es cualquier entidad que puede ser asignada a una variable: constantes, funciones, gráficas, estructuras de datos, etc.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

¿Qué operadores se usan para asignar objetos en R?

A

<-, -> y = (el más común es <-).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

¿Qué función muestra todos los objetos creados en la sesión de R?

A

ls()

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

¿Qué tipos de datos básicos hay en R?

A
  • logical (TRUE/FALSE)
  • integer (con sufijo L)
  • numeric
  • character
  • complex
  • raw
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

¿Qué tipos de datos compuestos existen en R?

A

vector, matrix, array, data.frame, list, function, Date, factor

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

¿Cómo saber el tipo de un objeto en R?

A

Con la función class(objeto)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

¿Qué operadores aritméticos básicos existen en R?

A

+, -, *, /, ^

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

¿Qué operadores especiales se usan para división?

A

%/% para división entera y %% para el residuo (módulo)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

¿Cómo redondear o truncar números en R?

A

round(x, digits) para redondeo, trunc(x) para eliminar decimales sin redondear.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

¿Qué funciones trigonométricas básicas hay en R?

A

sin(), cos(), tan(). Trabajan en radianes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

¿Qué funciones matemáticas avanzadas incluye R?

A

sqrt(), abs(), log(),
log(x, base), exp(), factorial()

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

¿Cómo se crean vectores en R?

A
v <- c(1, 2, 3)  
rep(5, 3)        
1:4              
seq(2, 10, 2) 
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

¿Cómo acceder a elementos en un vector en R?

A
v <- c(10, 20, 30, 40)  
v[2]       
v[-1] 
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

¿Qué funciones operan sobre vectores?

A
x <- c(3, 1, 4)  
length(x)   # Devuelve: 3  
sum(x)      # Devuelve: 8  
cumsum(x)   # Devuelve: 3 4 8  
sort(x)     # Devuelve: 1 3 4  
order(x)    # Devuelve: 2 1 3
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

¿Cómo detectar valores especiales en R?

A
v <- c(5, NA, NaN, Inf)  
# Devuelve: FALSE TRUE FALSE FALSE  
is.na(v)       
# Devuelve: FALSE FALSE TRUE FALSE  
is.nan(v)  
# Devuelve: FALSE FALSE FALSE TRUE
is.infinite(v) 
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
¿Qué operadores relacionales hay en R?
`<`, `<=`, `>`, `>=`, `==`, `!=`, `%in%`
26
¿Qué operadores lógicos existen en R?
``` a <- c(TRUE, FALSE) b <- c(FALSE, TRUE) # Devuelve: FALSE FALSE a & b # Devuelve: TRUE TRUE a | b # Devuelve: FALSE TRUE !a ```
27
¿Cómo se instala y usa un paquete en R?
``` install.packages("ggplot2") library(ggplot2) ```
28
¿Cómo acceder a la ayuda en R?
``` help(mean) ?mean ```
29
¿Cómo se importa un módulo en Python?
``` import math math.sqrt(16) from math import pi print(pi) ```
30
¿Qué es el reciclaje de vectores?
Es cuando R repite el vector más corto para igualar la longitud del más largo durante operaciones.
31
¿Qué es un paquete en R y cómo se gestiona?
Es un módulo que agrupa funciones y datos.
32
¿Qué es Python y cuál es su historia?
Es un lenguaje de programación creado por Guido van Rossum en los 80, diseñado para ser simple, legible y poderoso.
33
¿Qué características destacan en Python?
Orientado a objetos, código abierto, multiplataforma, fácil de aprender y compatible con otros lenguajes.
34
¿Qué es un módulo en Python?
Es un archivo que agrupa funciones, constantes o clases.
35
¿Qué es NumPy y qué aporta?
Es una librería que introduce el tipo `array` para trabajar con vectores, matrices y operaciones científicas.
36
¿Qué es SciPy?
Una librería basada en NumPy que extiende sus capacidades para resolver problemas científicos complejos.
37
¿Qué es scikit-learn?
Una biblioteca de aprendizaje automático con algoritmos listos para usar: clasificación, regresión, clustering, etc.
38
¿Cómo se crea un array en NumPy?
``` import numpy as np x = np.array([1, 2, 3]) print(x) ```
39
¿Cómo acceder a elementos en arrays de NumPy?
``` x = np.array([10, 20, 30, 40]) x[1] x[1:3] x[-1] ```
40
¿Cómo se accede a filas y columnas en un array 2D de NumPy?
``` arr = np.array([[1, 2], [3, 4]]) # Devuelve: [1 3] arr[:,0] # Devuelve: [1 2] arr[0,:] ```
41
¿Qué funciones útiles de generación ofrece NumPy?
``` # Devuelve: [0 1 2 3 4] np.arange(5) # Devuelve: [0. 0. 0.] np.zeros(3) # Devuelve: [1. 1. 1. 1.] np.ones(4) ```
42
¿Qué es un reporte auto-reproducible?
Es un documento que incluye texto, código, datos y resultados integrados, de forma que cualquier persona puede replicar el análisis exactamente con los mismos resultados. Esto mejora la transparencia científica.
43
¿Qué tecnologías permiten crear reportes auto-reproducibles en R?
R Markdown y Quarto, en conjunto con herramientas como knitr y pandoc.
44
¿Qué extensión tienen los archivos Quarto?
`.qmd`
45
¿Qué paradigma de edición sigue Quarto?
WYSIWYM: What You See Is What You Mean, donde se prioriza el contenido y estructura lógica sobre la apariencia visual.
46
¿Qué sección define la configuración de un documento Quarto?
La cabecera YAML. Aquí se definen metadatos como título, autor, fecha y formato de salida.
47
¿Qué hace la herramienta Pandoc en este contexto?
Convierte el archivo `.qmd` o `.md` a formatos como PDF, HTML o Word, interpretando el contenido y las instrucciones YAML.
48
¿Cómo se instala el paquete necesario para trabajar con Quarto en RStudio?
``` install.packages("rmarkdown") ```
49
¿Cómo se crea un documento Quarto en RStudio?
`File > New File > Quarto Document`
50
¿Qué lenguajes soporta Quarto además de R?
Python, Julia y Observable.
51
¿Qué formato usa Markdown para poner texto en itálicas y negritas?
- Itálicas: un asterisco. - Negritas: doble asterisco.
52
¿Cómo se representan fragmentos de código en línea en Markdown?
Con acentos graves.
53
¿Cómo se escribe una ecuación en línea con Markdown?
Encerrándola entre signos de dólar: `$expresion$`
54
¿Cómo se representan ecuaciones en bloque en Markdown?
Con doble dolar arriba y abajo $$
55
¿Cómo se escriben encabezados en Markdown?
- `# Título` - `## Subtítulo` - `### Sección`
56
¿Cómo se crean listas no ordenadas en Markdown?
Con `*`, `+` o `-` al inicio de cada ítem.
57
¿Cómo se cita texto en Markdown?
Usando el símbolo `>` antes del texto.
58
¿Qué es un chunk en Quarto?
Es una sección de código ejecutable.
59
¿Qué función genera tablas limpias para diferentes salidas?
``` library(knitr) kable(head(iris)) ```
60
¿Qué opción permite incrustar todos los recursos en un HTML generado con Quarto?
``` format: html: embed-resources: true ```
61
¿Qué es la estadística descriptiva?
Es la rama de la estadística que analiza, presenta y resume los datos recolectados de forma clara, sin hacer inferencias más allá de ellos.
62
¿Qué es la estadística inferencial?
Es la rama que permite hacer generalizaciones o predicciones sobre una población a partir de una muestra, usando estimaciones y pruebas de hipótesis.
63
¿Qué es una población y qué es una muestra?
Una población es el conjunto total de elementos que se estudian; una muestra es un subconjunto representativo de esa población.
64
¿Qué tipos de variables existen en estadística?
- Cualitativas: Nominales y ordinales - Cuantitativas: Discretas y continuas
65
¿Qué diferencia hay entre escalas de intervalo y de razón?
- Intervalo: el cero es arbitrario (ej. temperatura en °C) - Razón: el cero representa ausencia (ej. peso, ingresos)
66
¿Qué medidas de tendencia central existen?
Media, mediana y moda.
67
¿Qué medidas de dispersión existen?
Rango, rango intercuartílico (RIC), varianza, desviación estándar, coeficiente de variación.
68
¿Qué mide el coeficiente de variación?
La dispersión relativa con respecto a la media. Se expresa en porcentaje.
69
¿Qué mide el coeficiente de asimetría?
Mide si una distribución está sesgada hacia la izquierda (asimetría negativa) o hacia la derecha (asimetría positiva).
70
¿Qué mide la curtosis?
Mide la concentración de los datos alrededor de la media. - Leptocúrtica: muy picuda (ck > 3) - Mesocúrtica: forma normal (ck = 3) - Platicúrtica: aplanada (ck < 3)
71
¿Qué función calcula la media en R?
``` # Devuelve: 3 mean(c(1, 2, 3, 4, 5)) ```
72
¿Qué función calcula la mediana en R?
``` # Devuelve: 2 median(c(3, 1, 2)) ```
73
¿Qué función calcula los cuantiles en R?
``` quantile(c(1, 2, 3, 4, 5)) ```
74
¿Qué función calcula el rango intercuartílico en R?
``` IQR(c(1, 2, 3, 4, 5)) ```
75
¿Qué funciones muestran los valores mínimo y máximo en R?
``` min(c(3, 5, 1)) max(c(3, 5, 1)) ```
76
¿Qué función calcula la varianza en R?
``` var(c(2, 4, 6)) ```
77
¿Qué función calcula la desviación estándar en R?
``` sd(c(2, 4, 6)) ```
78
¿Cómo se calcula el coeficiente de variación en R?
``` x <- c(2, 4, 6) (sd(x) / mean(x)) * 100 ```
79
¿Qué paquete contiene la función para calcular la moda en R?
``` install.packages("DescTools") library(DescTools) Mode(c(1, 2, 2, 3)) ```
80
¿Qué paquete se usa para calcular asimetría y curtosis en R?
``` install.packages("moments") library(moments) x <- c(2, 4, 6) skewness(x) kurtosis(x) ```
81
¿Qué función en R da el rango total?
``` # Devuelve: 1 6 range(c(3, 6, 1)) ```
82
¿Cómo calcular la diferencia entre el valor máximo y mínimo?
``` # Devuelve: 8 diff(range(c(1, 5, 9))) ```
83
¿Qué es una variable aleatoria?
Es una función que asigna un valor numérico a cada posible resultado de un experimento aleatorio.
84
Qué es una distribución de probabilidad?
Es una función que asocia a cada valor posible de una variable aleatoria su probabilidad de ocurrencia.
85
¿Qué es una función de probabilidad para una variable aleatoria discreta?
Es una fórmula que describe la probabilidad de cada valor posible.
86
¿Qué es la distribución uniforme discreta?
Es aquella donde todos los valores posibles tienen la misma probabilidad.
87
¿Cómo se genera un número aleatorio uniforme discreto en R?
``` sample(1:6, 1) # Simula un dado ```
88
¿Qué hace la función `set.seed()` en R?
Fija una semilla para garantizar que los resultados aleatorios sean reproducibles.
89
¿Cómo se simula una distribución binomial en R?
``` # 15 ensayos con p = 0.8 rbinom(1, 15, 0.8) ```
90
¿Qué función genera números aleatorios uniformes continuos en R?
``` # Tres valores entre 4 y 9 runif(3, 4, 9) ```
91
¿Qué función genera números con distribución normal en R?
``` # 5 números normales estándar rnorm(5, mean = 0, sd = 1) ```
92
¿Qué es una matriz en R y cómo se crea?
Es una estructura bidimensional con datos del mismo tipo, creada con `matrix()`
93
¿Qué parámetro en `matrix()` permite llenar por filas?
``` matrix(1:6, 2, 3, byrow = TRUE) ```
94
¿Qué es una sentencia de selección en R?
Una instrucción que evalúa condiciones para ejecutar cierto código. (if)
95
¿Qué es un dataframe en R?
Es una estructura de datos tabular en forma de tabla, donde cada columna puede tener un tipo de dato distinto.
96
¿Cómo ver información general de un dataframe?
``` str(iris) summary(iris) ```
97
¿Cómo ver las primeras y últimas filas de un dataframe?
``` head(iris, 3) tail(iris, 2) ```
98
¿Cómo acceder a una columna por su nombre?
``` iris$Species iris[["Species"]] iris[, "Species"] ```
99
¿Cómo acceder a una fila o celda específica?
``` # Fila 1 completa iris[1, ] # Celda en fila 1, columna 3 iris[1, 3] # Subconjunto iris[5:7, 2:3] ```
100
¿Cómo seleccionar subconjuntos condicionales de un dataframe?
``` subset(iris, Sepal.Length > 6) iris[iris$Species == "setosa", ] ```
101
¿Qué función muestra los nombres de columnas?
`colnames(iris)`
102
¿Qué función muestra los nombres de filas?
`rownames(iris)`
103
¿Qué datasets precargados tiene R?
Se ven con `data()`
104
¿Cómo importar un archivo de texto como dataframe?
``` df <- read.table("archivo.txt", header = TRUE) df2 <- read.csv("archivo.csv") ```
105
¿Qué es un dato ordinal y cómo se representa en R?
Es un dato categórico con orden. Se usa con `factor(ordenado = TRUE)`
106
¿Cómo extraer una columna específica como vector?
``` iris$Petal.Width iris[, "Petal.Width"] ```
107
¿Qué función calcula la distancia entre observaciones?
``` dist(iris[, 1:4]) ```
108
¿Cómo se calcula la covarianza y la correlación en R?
``` cov(iris$Sepal.Length, iris$Petal.Length) cor(iris$Sepal.Length, iris$Petal.Length) ```
109
¿Cómo agrupar datos ordinales en intervalos y contar frecuencias?
``` edades <- c(15, 22, 34, 27, 40, 51) intervalos <- cut(edades, breaks = c(10, 20, 30, 40, 50, 60)) table(intervalos) ```
110
¿Qué función permite agrupar datos de intervalo para análisis de frecuencia?
``` cut(iris$Sepal.Length, breaks = 4) ```
111
¿Qué hace la familia de funciones apply()?
Permite aplicar funciones a filas o columnas de estructuras como matrices o dataframes. ``` apply(iris[, 1:4], 2, mean) ```
112
¿Qué hace la función `ave()`?
Calcula valores agrupados para cada subconjunto de un vector. ``` ave(iris$Sepal.Length, iris$Species, FUN = mean) ```
113
¿Cómo crear una tabla cruzada en R?
Con `table()` usando dos variables categóricas. ``` table(iris$Species, iris$Petal.Width > 1.5) ```