Pandas Flashcards
Cuál de los siguientes no es un tipo de datos en Pandas?
* Int16
* Char
* Bool
* Timedelta
Char
Los tipos de datos que no puedan ser inferidos son mostrados como undefined. Luego, pueden cambiarse a mano con astype.
True or false
False
Cada columna del dataframe puede ser tratada como una serie.
True or false
True
Si queremos saber cuanto ocupa un dataframe, podemos utilizar:
* len()
* size
* shape
* memory_usage()
memory_usage()
Si queremos obtener todos los elementos de la 2da columna de un dataframe podemos usar iloc[:,2]
True or false
True
Cuál de los siguientes elementos no forma parte de la estructura de un dataframe en Pandas?
* Column Index
* Range Index
* Index
* Row Index
Row Index
En Pandas, luego de hacer un groupby, es posible aplicar múltiples operaciones a distintos elementos utilizando
* agg
* apply
* run
* Transform
agg
Luego de aplicar múltiples operaciones luego de un groupby, obtenemos una estructura que cuenta con un multiIndex
True or false
True
Siempre tengo que aplicar fillna antes de aplicar pd.concat
True or false
False
El objeto que devuelve .loc se puede usar para
* Leer datos
* Escribir datos
* Ambas
* Ninguna de las dos
Ambas
Si tengo un DataFrame df y genero df2 haciendo concat de df consigo mismo
* df2 va a tener mas cantidad de filas que df
* df2 va a tener menos cantidad de filas que df
* df2 va a tener igual cantidad de filas que df
* No es posible saberlo
df2 va a tener mas cantidad de filas que df
Se puede aplicar df.pivot unicamente
* Si la columna de valores no repite datos
* Si la columna de valores tiene datos numéricos
* Si la columna de valores no contiene valores NaN
* Todas las anteriores son incorrectas
Todas las anteriores son incorrectas
En el caso general, usar apply para sumar dos columnas col_1 y col_2
- Es mas eficiente que hacer df.col_1 + df.col_2
- Es menos eficiente que hacer df.col_1 + df.col_2
- apply no se puede utilizar para sumar columnas
- Me devuelve un nuevo DataFrame
Es menos eficiente que hacer df.col_1 + df.col_2
Si tengo un DataFrame con unicamente enteros y asigno una cadena a una posicion
* La fila cambia su dtype a object
* La fila cambia su dtype a string
* La columna cambia su dtype a object
* La columna cambia su dtype a string
La columna cambia su dtype a object
Al hacerle describe a un df vemos que mean de col_1 == col_2 y que std de col_1 < col_2
* col_1.max() > col_2.max()
* col_1.max() = col_2.max()
* col_1.max() < col_2.max()
* No es posible saberlo
No es posible saberlo
Si se que df.pivot(“A”,”B”,”C”) y df.pivot_table(“A”,”B”,”C”) devuelven exactamente el mismo df (valores y dtypes)
* No hay valores NaN en ninguna de las dos tablas pivot
* La unica forma es si los valores de C son iguales a su promedio
* La unica forma es si cada par ‘A’,’B’ tiene asignado un unico valor de ‘C’
* Se le hizo previamente df.fillna(0,inplace=True)
La unica forma es si cada par ‘A’,’B’ tiene asignado un unico valor de ‘C’
Si tengo un DataFrame unicamente de valores float y asigno una cadena a una celda arbitraria
* La fila cambia su dtype a object
* La columna cambia su dtype a object
* La fila cambia su dtype a string
* La columna cambia su dtype a string
La columna cambia su dtype a object
El método ‘map’
* Me deja transformar una serie en un diccionario (hashmap)
* Me deja mapear los valores de un grupo a una nueva columna
* Le aplica una funcion lambda a un DataFrame
* Ninguna es correcta
Ninguna es correcta
DataFrame no tiene un metodo map porque
* Un DataFrame no tiene un tipo de dato definido
* DataFrame tiene apply
* Es equilvalente a un for x in df
* Mentira, si tiene
Un DataFrame no tiene un tipo de dato definido
Siempre tengo que aplicar antes fillna para poder usar concat
True or false
False