Telechargé par assem.mohsen

annexe pandas

publicité
Annexe Pandas
Action
Importation des
bibliothèques
Chargement des
données
Manipulation
d’un DataFrame
Affichage des
données d’un
DataFrame
Syntaxe
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv("chemin_fichier/fichier.csv", sep=",", decimal=".", enconding="utf8")
df = pd.read_excel("chemin_fichier/fichier.xlsx")
Renommage des colonnes :
df.rename(columns = {"col1":"nouv_nom_col1", …,
"colN":"nouv_nom_colN"}, inplace=True)
Suppression des lignes :
df.drop([Indice_Ligne], inplace=True)
Suppression des colonnes :
df.drop(columns=["Col1",…,"ColN"],inplace=True)
Modification d’une cellule :
df[num_ligne,"Nom_colonne"]=Valeur
Modification d’une ligne :
df.loc[num_ligne]=[Liste_Valeurs]
Dimensions :
print(df.shape)
Nombre d’éléments :
print(df.size)
Informations sur les colonnes :
df.info()
Résumé rapide :
df.describe()
Noms des colonnes :
print(df.columns)
Contenu du DataFrame
print(df)
Contenu d’une colonne :
print(df.Id_Col) ou bien print(df["Id_Col"])
n premières lignes :
print(df.head(n))
n dernières lignes:
print(df.tail(n))
Une colonne entre deux positions :
print(df.Id_Col[Pos_Deb:Pos_Fin])
Une ligne par son indice :
print(df.iloc[indice])
Une ligne par son label :
print(df.loc[label])
Une cellule :
print(df.iloc[num_ligne,num_col])
Affichage selon une condition :
print(df[df["Nom_Colonne"] Op valeur])
Affichage selon deux conditions :
print(df[(df["Nom_Colonne"] Op Valeur) Op_Logique
(df["Nom_Colonne"] Op Valeur)])
Op
Op_Logique
Les fonctions
statistiques sur
les DataFrame
==
&
!=
>
Et logique (toutes les conditions
sont réalisées)
Moyenne d'une colonne :
print(df.col.mean())
Valeur minimale d'une colonne :
print(df.col.min())
Valeur maximale d'une colonne :
print(df.col.max())
Somme d'une colonne :
print(df.col.sum())
Nombre de valeur non nulles d'une
colonne :
print(df.col.count())
>=
|
<
Ou logique (une des conditions est
réalisée)
Tri des éléments df.sort_index(inplace=True)
d’un DataFrame df.sort_values(by = ["col1", "col2"],ascending = [True/False,True/False]))
Graphiques
<=
Graphique à barres :
df.plot.bar(x='Col_Abscisse', y='Col_Ordonnée',
title=’Titre_Graphique’, color=’couleur’)
Graphique en courbe :
df.plot.line(x='Col_Abscisse', y='Col_Ordonnée',
title=’Titre_Graphique’,color=’couleur’)
Affichage d’un graphique :
plt.show()
Téléchargement