Annexe Pandas Action Importation des bibliothèques Chargement des données Manipulation d’un DataFrame Affichage des données d’un DataFrame Syntaxe import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv("chemin_fichier/fichier.csv", sep=",", decimal=".", enconding="utf8") df = pd.read_excel("chemin_fichier/fichier.xlsx") Renommage des colonnes : df.rename(columns = {"col1":"nouv_nom_col1", …, "colN":"nouv_nom_colN"}, inplace=True) Suppression des lignes : df.drop([Indice_Ligne], inplace=True) Suppression des colonnes : df.drop(columns=["Col1",…,"ColN"],inplace=True) Modification d’une cellule : df[num_ligne,"Nom_colonne"]=Valeur Modification d’une ligne : df.loc[num_ligne]=[Liste_Valeurs] Dimensions : print(df.shape) Nombre d’éléments : print(df.size) Informations sur les colonnes : df.info() Résumé rapide : df.describe() Noms des colonnes : print(df.columns) Contenu du DataFrame print(df) Contenu d’une colonne : print(df.Id_Col) ou bien print(df["Id_Col"]) n premières lignes : print(df.head(n)) n dernières lignes: print(df.tail(n)) Une colonne entre deux positions : print(df.Id_Col[Pos_Deb:Pos_Fin]) Une ligne par son indice : print(df.iloc[indice]) Une ligne par son label : print(df.loc[label]) Une cellule : print(df.iloc[num_ligne,num_col]) Affichage selon une condition : print(df[df["Nom_Colonne"] Op valeur]) Affichage selon deux conditions : print(df[(df["Nom_Colonne"] Op Valeur) Op_Logique (df["Nom_Colonne"] Op Valeur)]) Op Op_Logique Les fonctions statistiques sur les DataFrame == & != > Et logique (toutes les conditions sont réalisées) Moyenne d'une colonne : print(df.col.mean()) Valeur minimale d'une colonne : print(df.col.min()) Valeur maximale d'une colonne : print(df.col.max()) Somme d'une colonne : print(df.col.sum()) Nombre de valeur non nulles d'une colonne : print(df.col.count()) >= | < Ou logique (une des conditions est réalisée) Tri des éléments df.sort_index(inplace=True) d’un DataFrame df.sort_values(by = ["col1", "col2"],ascending = [True/False,True/False])) Graphiques <= Graphique à barres : df.plot.bar(x='Col_Abscisse', y='Col_Ordonnée', title=’Titre_Graphique’, color=’couleur’) Graphique en courbe : df.plot.line(x='Col_Abscisse', y='Col_Ordonnée', title=’Titre_Graphique’,color=’couleur’) Affichage d’un graphique : plt.show()