annexe pandas

Telechargé par assem.mohsen
Annexe Pandas
Action Syntaxe
Importation des
bibliothèques
import pandas as pd
import matplotlib.pyplot as plt
Chargement des
données
df = pd.read_csv("chemin_fichier/fichier.csv", sep=",", decimal=".", enconding="utf8")
df = pd.read_excel("chemin_fichier/fichier.xlsx")
Manipulation
d’un DataFrame
Renommage des colonnes : df.rename(columns = {"col1":"nouv_nom_col1", …,
"colN":"nouv_nom_colN"}, inplace=True)
Suppression des lignes : df.drop([Indice_Ligne], inplace=True)
Suppression des colonnes : df.drop(columns=["Col1",…,"ColN"],inplace=True)
Modification dune cellule : df[num_ligne,"Nom_colonne"]=Valeur
Modification dune ligne : df.loc[num_ligne]=[Liste_Valeurs]
Affichage des
données d’un
DataFrame
Dimensions : print(df.shape)
Nombre d’éléments : print(df.size)
Informations sur les colonnes : df.info()
Résumé rapide : df.describe()
Noms des colonnes : print(df.columns)
Contenu du DataFrame print(df)
Contenu d’une colonne : print(df.Id_Col) ou bien print(df["Id_Col"])
n premières lignes : print(df.head(n))
n dernières lignes: print(df.tail(n))
Une colonne entre deux positions : print(df.Id_Col[Pos_Deb:Pos_Fin])
Une ligne par son indice : print(df.iloc[indice])
Une ligne par son label : print(df.loc[label])
Une cellule : print(df.iloc[num_ligne,num_col])
Affichage selon une condition : print(df[df["Nom_Colonne"] Op valeur])
Affichage selon deux conditions : print(df[(df["Nom_Colonne"] Op Valeur) Op_Logique
(df["Nom_Colonne"] Op Valeur)])
Op == != > >= < <=
Op_Logique &Et logique (toutes les conditions
sont réalisées)
|Ou logique (une des conditions est
réalisée)
Les fonctions
statistiques sur
les DataFrame
Moyenne d'une colonne : print(df.col.mean())
Valeur minimale d'une colonne : print(df.col.min())
Valeur maximale d'une colonne : print(df.col.max())
Somme d'une colonne : print(df.col.sum())
Nombre de valeur non nulles d'une
colonne : print(df.col.count())
Tri des éléments
d’un DataFrame
df.sort_index(inplace=True)
df.sort_values(by = ["col1", "col2"],ascending = [True/False,True/False]))
Graphiques
Graphique à barres : df.plot.bar(x='Col_Abscisse', y='Col_Ordonnée',
title=’Titre_Graphique’, color=’couleur’)
Graphique en courbe : df.plot.line(x='Col_Abscisse', y='Col_Ordonnée',
title=’Titre_Graphique’,color=’couleur’)
Affichage d’un graphique : plt.show()
1 / 1 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !