python 6 - Pandas Flashcards

(24 cards)

1
Q

commande pour importer panda

A

import panda as pd

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

comment lire un DataFrame à partir d’un fichier CSV

A

df = pd.read_csv(“data/communes-france-2025.csv”)

(df signifie dataframe)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Comment afficher le DataFrame pour vérifier son contenu

A

type(df)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Comment afficher les 3 premières lignes du DataFrame

A

df.head(3)
si on met rien entre parenthèses ça affiche par défaut les 5 premières lignes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Comment afficher les 3 dernières lignes du DataFrame

A

df.tail(3)
si on met rien entre parenthèses ça affiche par défaut les 5 dernières lignes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Comment afficher aperçu statistique des colonnes numériques

A

df.describe(include=”all”)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Comment afficher les noms des colonnes

A

df.columns

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Comment faire le lien avec SQL ?

A

df.query(“population > 300000 and population < 1000000”)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qu’est ce qu’une série ?

A

Une série est un tableau à une dimension qui peut contenir des données de différents types (entiers, flottants, chaînes de caractères, etc.). C’est un vecteur numpy avec un index des lignes.

Une colonne ou une ligne d’un DataFrame Pandas est une Série.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Comment accède t on à une série ?

A

On y accède en utilisant le nom de la colonne entre crochets: df['nom de colonne'] : sélectionne une colonne

serie_code_insee = df[“code_insee”]

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Comment vérifier le type d’une colonne ?

A

type(serie_code_insee)
# Une colonne est un objet Series

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Comment adapter les types d’une série ?

A

On peut également adapter les types des Series avec des méthodes comme astype()

df[“dep_code”] = df[“dep_code”].astype(str)

df[“population”] = df[“population”].astype(int)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

comment sélectionner des colonnes spécifiques

A

cols = [
“code_insee”,
“nom_standard”,
“latitude_mairie”,
“longitude_mairie”,
“altitude_minimale”,
“altitude_maximale”,
]
df[cols].head()

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Comment appliquer une condition ?

A

population = df[“population”]
cond = population >= 1000
cond.head()

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Sélectionner les villes avec une population supérieure à 200 000

A

df[df[“population”] >= 200_000].head()

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Comment on ajoute une colonne

A

df[“Pays”] = “France”
df.head()

df[“denivele”] =
(df.altitude_maximale -df.altitude_minimale)
# pd.DataFrame.__setitem__(self, key, value)

17
Q

Comment modifier une colonne ?

A

Transformer la colonne “denivele” en m en cm
df[“denivele”] = df[“denivele”] * 100

18
Q

Comment supprimer une colonne ?

A

df = df.drop(columns=”denivele”, axis=1)

19
Q

comment renommer une colonne

A

df = df.rename(
columns={
“denivele”: “denivele_m”,
}
)

20
Q

comment effectuer la somme sur 1 colonne ? (ou 2 ?)

A

df[[“population”, “superficie_km2”]].sum(axis=0)

renvoie

population 67648309
superficie_km2 615991

21
Q

comment effectuer la moyenne sur une colonne ?

A

population = df[“population”]
population.mean()

22
Q

comment utiliser groupby

A

df_population_par_departement = df.groupby(“dep_code”)[“population”].sum()

23
Q

à quoi sert la fonction agregate

A

La fonction aggregate permet quant-à elle de personnaliser les fonctions appliquées par colonne. Il est possible en un seul appel de grouper les données et d’appliquer plusieurs statistiques sur les colonnes du DataFrame.