Journée Python IPSL - 14 octobre 2013
TP Python - 1er Chapitre
Introduction à Python : manipulation interactive
L'objectif de ce TP est en premier lieu de prendre contact avec Python en douceur, en
vous familiarisant à la manipulation interactive de données. Nous vous proposons notam-
ment :
•de lire des séries de données contenues dans un fichier ASCII;
•d'en extraire des informations statistiques (moyenne, écart-type, etc.);
•de créer des vecteurs de dates;
•d'effectuer des régressions simples;
•d'obtenir une représentation visuelle des données (séries temporelles, histogrammes)
avec Matplotlib.
1. Environnement
•Créez le répertoire TP1 dans votre $HOME. Allez dans ce répertoire. Copiez depuis
$HOME/../python1/TP1 le fichier nommé ALS_LNA_RAD_TSI_2002_2009_eps5_com-
plet.asc. Ce fichier ASCII contient des données organisées en 19 colonnes, chaque
ligne décrivant une heure d'observation. Ce jeu de données décrit certaines propriétés de
la couverture nuageuse au-dessus du SIRTA (le site instrumenté de Palaiseau) depuis
2002, et provient d'observations combinées de plusieurs instruments (radiomètre, lidar).
•Vous pouvez afficher ce fichier avec la commande more pour en étudier le contenu. Vé-
rifiez que les 5 premières colonnes décrivent la date et l'heure de la mesure (au format
AAAA MM JJ hh minutes). Au cours de ce TP nous utiliserons ces données et également
l'altitude de la base de nuages bas (colonne 10), moyen (11) et haut (12) en km.
•Lancez ipython -pylab si ce n'est pas déjà fait.
2. Chargement et extraction des données
•Chargez les données contenues dans le fichier dans une variable data dans l'environ-
nement ipython en utilisant la commande loadtxt de numpy. Si vous rencontrez un pro-
blème lié au format du fichier, la solution réside sans doute dans l'utilisation d'un argument
particulier de loadtxt, la liste des arguments possibles peut être obtenue par help
loadtxt.
•Vérifiez avec la commande whos que les 19 colonnes de données ont bien été chargées
dans data, notez la longueur de chaque colonne.
•Utilisez le "slicing" sur data pour extraire :
•les 5 premières colonnes (index 0, 1, 2, 3, 4) dans les variables aa, mm, jj, hh, mi-
nutes (éviter "min")
•les colonnes 10, 11, 12 (index 9, 10, 11) dans les variables cblow, cbmid, cbhigh.
•Vérifiez avec whos que les dimensions des variables sont cohérentes.
1