¿Qué se debe hacer en caso de duda sobre si una función es un método o una función general?
Respuesta: Consultar la documentación de Pandas.
Explicación: La documentación oficial es la fuente más rápida y fiable para entender cómo se debe llamar una función y qué tipo de datos acepta.
¿Qué significan los operadores booleanos >, <, >= y <=?
Respuesta: > (mayor que), < (menor que), >= (mayor o igual que), <= (menor o igual que).
Explicación: Estos son los operadores de comparación estándar utilizados en las condiciones booleanas.
¿Por qué groupby se considera un método y no una función general?
Respuesta: Porque está estrechamente ligado a la estructura y operaciones del DataFrame.
Explicación: Su funcionalidad depende intrínsecamente de la estructura de un DataFrame, por lo que se implementa como un método de este.
¿Cómo se filtra un DataFrame?
Respuesta: Usando una condición Booleana dentro de corchetes.
Explicación: La sintaxis df[condición] selecciona únicamente las filas del DataFrame df donde la condición es True.
¿Qué es NumPy?
Respuesta: Es una librería fundamental de Python para la computación numérica.
Explicación: Su nombre completo es Numerical Python, y es la base para muchas operaciones numéricas eficientes en el ecosistema de ciencia de datos de Python.
¿Cuándo se debe usar np.where()?
Respuesta: Para elecciones binarias (if/else).
Explicación: Su uso óptimo es cuando hay una única condición que resulta en dos posibles salidas.
Según la tabla, ¿para qué es mejor el método np.select()?
Respuesta: Múltiples condiciones, lógica basada en reglas.
Explicación: Sus pros son que es estructurado y escalable. Su contra es que puede ser ligeramente verboso.
¿Cómo se añade una nueva columna con un valor calculado a un DataFrame?
Respuesta: Creando un nuevo nombre de columna y asignándole un cálculo basado en columnas existentes.
Explicación: La sintaxis es df[‘nueva_columna’] = cálculo, lo que realiza la operación fila por fila y la almacena en la nueva columna.
Al filtrar, ¿qué filas selecciona una condición Booleana?
Respuesta: Las filas donde la condición es True.
Explicación: El filtrado booleano funciona evaluando una condición para cada fila y conservando solo aquellas que cumplen con dicha condición.
En el estilo ‘Function first’ (Función General), ¿dónde van los datos?
Respuesta: Dentro de los paréntesis.
Explicación: Un ejemplo de este estilo es pd.melt(df), donde el DataFrame df se pasa como argumento dentro de los paréntesis.
Menciona ejemplos de Funciones Generales proporcionados en el texto.
Respuesta: pd.to_datetime(), pd.concat(), pd.merge(), pd.pivot_table().
Explicación: Estos son ejemplos de funciones que se llaman directamente desde la librería pandas (pd.) y toman los datos como argumento.
¿Cuál es la ventaja de np.where() y np.select() sobre .apply() con una función personalizada?
Respuesta: Ambos son más rápidos y limpios.
Explicación: Estas funciones de NumPy están optimizadas para operaciones vectorizadas, lo que las hace significativamente más eficientes en grandes conjuntos de datos en comparación con .apply(), que opera fila por fila.
Según la tabla, ¿para qué es mejor el método np.where()?
Respuesta: Una condición, dos salidas (sí/no).
Explicación: Sus pros son la rapidez y la limpieza del código, mientras que su contra es que se vuelve desordenado con más de dos condiciones.
¿Qué significa el operador booleano !=?
Respuesta: No igual a.
Explicación: Se utiliza para verificar si dos valores son diferentes.
Según la tabla, ¿para qué es mejor el método .apply()?
Respuesta: Lógica compleja, fila por fila (multi-columna).
Explicación: Sus pros son su flexibilidad y potencia. Su contra es que es más lento en grandes conjuntos de datos.
¿Qué función se menciona como un ejemplo de ‘Doble Identidad’?
Respuesta: melt.
Explicación: melt es un caso especial que puede ser utilizado tanto como una función general (pd.melt(df)) como un método (df.melt()).
¿Cuándo se debe usar np.select()?
Respuesta: Para múltiples categorías o lógica escalonada (tiered logic).
Explicación: Es la opción preferida cuando se necesita evaluar una serie de condiciones para asignar valores de diferentes categorías.
Escribe el código de ejemplo para filtrar un DataFrame donde la columna ‘Product’ es igual a ‘TrackPro’.
Respuesta: filtered_df = df[df[‘Product’] == ‘TrackPro’]
Explicación: Este código crea un nuevo DataFrame filtered_df que contiene solo las filas del DataFrame original df donde el valor en la columna ‘Product’ es ‘TrackPro’.
¿Qué proporciona NumPy?
Respuesta: Operaciones con arrays rápidas y eficientes.
Explicación: A pesar de que trabajemos con Pandas, muchas de las funciones subyacentes, especialmente las de lógica condicional, dependen del rendimiento de NumPy.
Escribe el código de ejemplo para filtrar un DataFrame donde ‘Product’ es ‘TrackPro’ Y ‘Year’ es mayor o igual a 2023.
Respuesta: filtered_df = df[(df[‘Product’] == ‘TrackPro’) & (df[‘Year’] >= 2023)]
Explicación: Este ejemplo muestra cómo combinar dos condiciones con el operador & (AND), asegurándose de que cada condición esté entre paréntesis.
¿Qué retorna el método df.groupby()?
Respuesta: Un objeto DataFrameGroupBy.
Explicación: Este es un objeto intermedio y potente que agrupa los datos del DataFrame para operaciones posteriores.
¿Qué función de NumPy se usa cuando hay más de dos condiciones a evaluar?
Respuesta: np.select().
Explicación: Es la herramienta adecuada para lógica con múltiples categorías o reglas escalonadas, donde se deben evaluar varias condiciones en secuencia.
¿Cuál es la sintaxis de np.where()?
Respuesta: np.where(condition, value_if_true, value_if_false)
Explicación: La función toma tres argumentos: la condición a evaluar, el valor a devolver si la condición es verdadera, y el valor a devolver si es falsa.
¿Qué significa el operador booleano ==?
Respuesta: Igual a.
Explicación: Se utiliza para comparar si dos valores son iguales. Es importante no confundirlo con el signo de igual único (=), que se reserva para la asignación de variables.