Programmation Scientifique avec Python [email protected] (légèrement modifié par F.Faure) 23 octobre 2016 Table des matières I Base de Python 3 1 Introduction 3 2 Installation de Python 4 3 Programmer avec Python 3.1 Ligne de Commande ou éditeur ? . . . . . . . . . . . 3.2 Documentation . . . . . . . . . . . . . . . . . . . . 3.2.1 Aide en ligne . . . . . . . . . . . . . . . . . 3.2.2 Livres . . . . . . . . . . . . . . . . . . . . . 3.3 Environnement de programmation . . . . . . . . . . 3.4 Variables et types de données . . . . . . . . . . . . . 3.4.1 Variables simples . . . . . . . . . . . . . . . 3.4.2 Opérations : . . . . . . . . . . . . . . . . . . 3.4.3 Nombres complexes . . . . . . . . . . . . . 3.4.4 Chaînes de caractères . . . . . . . . . . . . . 3.4.5 Listes . . . . . . . . . . . . . . . . . . . . . 3.4.6 Vecteurs de nombres . . . . . . . . . . . . . 3.4.7 Matrices de nombresimporter le m . . . . . . 3.4.8 Tuple [Facultatif] . . . . . . . . . . . . . . 3.4.9 Dictionnaires [Facultatif] . . . . . . . . . . 3.4.10 Conversion de variables entre différents types 3.5 Boucles et opérateurs . . . . . . . . . . . . . . . . . 3.5.1 opérateurs ==,and, or , not . . . . . . . . . 3.5.2 L’instruction if...elif..else . . . . . . . 3.5.3 La boucle while . . . . . . . . . . . . . . . 3.5.4 Les boucles for . . . . . . . . . . . . . . . 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 4 5 5 5 5 6 6 7 7 8 9 10 10 11 11 12 12 12 13 14 14 3.6 3.7 3.8 4 5 II 6 7 3.5.5 Exercice : la conjecture de Syracuse . . Fonctions . . . . . . . . . . . . . . . . . . . . Portée des objets : variables locales et globales Exercice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Classes et Objets 4.1 Présentation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Exemple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3 Variables membre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4 Fonctions membres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5 Fonctions membres spéciales [Facultatif] . . . . . . . . . . . . . . . . . 4.5.1 Constructeur __init__ . . . . . . . . . . . . . . . . . . . . . . 4.5.2 Destructeur __del__ . . . . . . . . . . . . . . . . . . . . . . . . 4.5.3 Opérateurs __add__, __sub__, __mul__, __div__, __pow__ . . 4.6 Héritage [Facultatif] . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.7 Attention : opérateur “==”, différence entre égalité et identité, copie et rence... [Facultatif] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.8 Exercice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . réfé. . . . . . . . . . 15 15 16 17 . . . . . . . . . 17 17 18 18 19 20 20 20 20 21 . 21 . 22 Lecture et écriture de fichiers 23 5.1 Exercice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 Modules scientifiques 24 Utilisation de “modules” (standards et librairies extérieures) 6.1 math . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2 Scipy (scientific python, http ://www.scipy.org) . . . . . . . . 6.2.1 Exemples . . . . . . . . . . . . . . . . . . . . . . . . 6.2.2 Sous-modules de scipy . . . . . . . . . . . . . . . . . 6.2.3 Extensions ou applications de scipy . . . . . . . . . . 6.3 Tracé de données scientifiques (1D, 2D) avec matplotlib/pylab 6.3.1 Courbe 1D . . . . . . . . . . . . . . . . . . . . . . . 6.3.2 Courbe 2D . . . . . . . . . . . . . . . . . . . . . . . 6.4 Autres modules scientifiques . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 24 25 25 26 27 27 27 28 28 Performance et interface C/C++ <-> Python [Facultatif] 7.1 Performance : C/C++ vs Python . . . . . . . . . . . . . . . . . . . . . . . . . . 7.1.1 Utilisation de scipy.weave . . . . . . . . . . . . . . . . . . . . . . . . . 7.2 Interface C/C++ <-> Python avec SWIG . . . . . . . . . . . . . . . . . . . . . . 29 29 30 31 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 Fenêtres et graphiques avec wxPython 32 8.1 Animation : corde pendante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 8.2 Animation et calcul . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 Première partie Base de Python 1 Introduction Il existe déjà un grand nombre de langages utilisés pour le calcul scientifique (C/C++/fortran), stabilisés et développés depuis de nombreuses années. Pourquoi développer (et donc apprendre !) un nouveau langage ? Il s’avère que les langages traditionnels sont soit inadaptés à une utilisation généraliste (calculs et création d’un interface graphique - ex : fortran), ou ont une syntaxe suffisamment complexe ou rigide pour rendre difficile son utilisation par un utilisateur occasionnel (c++). C’est ce qui a permis le succès de logiciels commerciaux spécialisés dans le calcul (Mathematica, Maple, Mathlab,...), et de langages (IDL,...), qui associent une syntaxe relativement simple avec des fonctionnalités (représentation graphique, librairies de calcul) étendues, et utilisables directement à partir d’une ligne de commande (sans compilation préalable). C’est pour pallier ce manque que le langage Python (http ://www.python.org) a été développé. Il présente de multiples avantages par rapport aux langages traditionnels : — naturel (utilisation de l’indentation, typage dynamique) — utilisable en ligne de commande (donc interactif ) — moderne (orienté objet) — extensible (modules externes de calcul et de visualisation écrites en C/C++/fortran) — très utilisé pour le calcul scientifique (grâce à la réutilisation de librairies de calculs déjà existantes) — libre (“open-source”) et multi-plateforme (Linux, windows, MacOS,...) Python est un langage compilé “au dernier moment”, et donc plus lent qu’un langage compilé (fortran/c/c++). Ce n’est en fait pas un inconvénient, car chaque fois qu’un calcul “intensif” est nécessaire, il est possible de l’effectuer dans un module externe écrit dans un autre langage, plus efficace. En général seule une petite partie d’un programme a besoin d’être vraiment optimisée (en général moins de 5% du code représente 95% du temps de calcul !). En outre, il s’avère que l’on passe souvent plus de temps à écrire un programme qu’à l’utiliser, ce qui relativise l’importance de la “performance pure” du programme. L’intérêt de python est justement d’accélérer le développement d’un programme par sa syntaxe simple, et par sa capacité à réutiliser des librairies existantes. Les différences fondamentales par rapport au C++ avec lesquelles il faut se familiariser 3 sont : — C’est un langage interprété (en fait, “compilé au dernier moment”), utilisable avec une ligne de commande — Les “blocs” de code (ex : intérieur d’une boucle) sont identifiés par l’indentation (nombre d’espaces en début de ligne), et non par des acollades {...} — Le type des objets (’int’, ’float’, ’string’) est dynamique, ç.à.d. qu’il n’a pas besoin d’être déclaré à l’avance et qu’il peut être modifié au cours du programme. 2 Installation de Python Sous Linux : Python est installé sur toutes les distributions, en standard - il est par contre nécessaire d’ajouter des modules tels que SciPy et matplotlib, suivant le type de programme souhaité. Sous Windows : la distribution standard de python est disponible sur http ://www.python.org, mais il est recommandé d’installer la version de python de la société Enthought (Enthought Python = Enthon), qui inclut les modules de calculs scientifique les plus utiles http ://code.enthought.com/enthon/. 3 3.1 Programmer avec Python Ligne de Commande ou éditeur ? Python peut être utilisé à partir d’une ligne de commande (langage interprété). Pour lancer l’interpréteur, taper “python” dans une console linux, puis à l’invite de commande (“>>>”), taper “print toto”. Cela donne >>> print "toto" toto >>> Dans un autre langage, il aurait fallu écrire le texte du programme dans un fichier, puis le compiler avant de l’éxécuter. En fait il est également possible d’écrire le programme dans un fichier. Pour cela ouvrir un éditeur de texte (par exemple kwrite, nedit ou kate), écrire le programme (print toto), et le sauvegarder sous le nom toto.py. Ensuite, éxécuter le programme avec la commande “python toto.py” à partir d’une console Linux (il est également possible d’utiliser “python -i toto.py” afin de rester dans l’interpréteur après éxécution du programma). De fait, écrire un programme sur la ligne de commande ou le taper au préalable dans un fichier avant de l’exécuter est rigoureusement équivalent. Pour l’utilisation en ligne de commande, il est encore plus avantageux d’utiliser ipython : “ipython toto.py” - c’est une version plus interactive de python, qui se souvient des instructions tapées lors de la dernière session ipython (utiliser les flèches haute et basse pour naviguer 4 dans l’historique des commandes), et qui sait “compléter” les commandes (pour utiliser une fonction ou un objet, taper le début du nom et appuyer sur la touche tabulation - le nom sera complété ou différents choix seront proposés). Voilà ! Vous savez programmer en Python. Dans la pratique, les tests rapides sont faits avec la ligne de commande, et les programmes longs sont écrits dans un fichier avant d’être exécutés. Remarques : — pour sortir de l’interpréteur Python, taper ctrl-d — le symbole # sert à commencer un commentaire en python. Tout ce qui se trouve sur une ligne après un # n’est pas interprété par python : >>> print toto # ceci est mon premier programme en python ! toto — pour éxécuter des commandes dans un fichier texte depuis l’interpréteur python, il faut utiliser la fonction execfile (e.g. execfile(toto.py)) — pour pouvoir utiliser des accents dans Python, il faut préciser l’encodage que nous utilisons, en mettant au début du fichier python la ligne suivante : # -*- coding: iso-8859-15 -*- 3.2 3.2.1 Documentation Aide en ligne Tous les objets standards (de même que les modules correctement conçus) possèdent une aide en ligne, qui peut ête invoquée avec la fonction help(). Par exemple help(str), help(list), permettent d’accéder à l’aide sur les chaînes de caractère et sur les listes. Lorsqu’un module est importé (e.g. ’import math’), il est possible de lire l’aide correspondant à ce module (e.g. ’help(math)’) ou à une fonction de ce module (e.g. ’help(math.sin)’). Lorsque ipython est utilisé, c’est encore plus simple, il suffit de taper la commande suivie de un ou deux points d’interrogations (suivant le détail de la documentation souhaitée), par exemple : 'list?'. 3.2.2 Livres Un tutorial sur le web (et autres documents) : http ://www.python.org/ 3.3 Environnement de programmation En anglais : Integrated Development Environment (I.D.E.). C’est un logiciel qui contient un éditeur afin d’écrire les commnades pythons, mais qui propose aussi beaucoup de fonctionnalités spécifiques à la programmation (recherche d’erreurs,...). Il existe de nombreux IDE, nous recommandons par exemple : eric 5 3.4 3.4.1 Variables et types de données Variables simples Pour créer une variable, il suffit de lui affecter une valeur : >>> x=1 >>> print x 1 On voit ici une différence importante avec d’autres langages : il n’est pas nécessaire de déclarer a priori le type de la variable x (entier ’int’, nombre flottant ’float’, chaine de caractère ’string’,...). Pourtant ce type existe bien, si vous demandez ensuite : >>> print type(x) <type 'int'> Python a donc automatiquement décidé que x était un entier (int = integer). Essayez avec d’autres initialisations : “x=1.0” (nombre flottant ou float), “x=bonjour” (chaine de caractère ou string),... On peut affecter plusieurs variables à la fois : >>> x,y=1,2 >>> print x,y 1 2 >>> x=y=1 >>> print x,y 1 1 Pour demander une variable : >>> x=input(x=?) x=? 2 >>> print x 2 Si on veut que x soit une chaine de caractère, et ne soit pas convertit il faut écrire plutot : >>> x=raw_input(x=?) x=?2 >>> print type(x) <type 'str'> Il est à noter qu’il est possible de changer le type de x en lui affectant des valeurs différentes : >>> x=57 >>> type(x) <type 'int'> >>> x="Astérix" >>> type(x) <type 'str'> >>> x=3.14159263 >>> type(x) 6 <type 'float'> Bien que cela soit pratique, cela peut entraîner des erreurs de programmation, donc dans la mesure du possible il faut toujours utiliser des noms de variables explicites (age sera un entier, nom une chaîne de caractères, etc...), et ne pas changer de type en cours de programme. Attention : majuscules et minuscules sont différenciées par python, i.e. mavariable, MAVARIABLE et MaVariable sont trois variables distinctes. Il en va de même pour tous les motclefs et les fonctions en python. 3.4.2 Opérations : >>> print 7/2, 7./2 # division 3 3.5 Noter que le premier résultat a donné la partie entière de la division (division euclidienne). Avec le point, la deuxième division a été effectuée avec les nombres à virgule. >>> print 3**2 # puissance 9 >>> print 4%3, -1%3 # renvoit 4 modulo 3 et -1 modulo 3 1 2 Rappel : n%q est le reste de la division euclidienne de n par q : n : −2 −1 0 1 2 3 4 5 n%3 1 2 0 1 2 0 1 2 Pour calculer une racine carrée : >>> from math import * # cela importe le module de math >>> sqrt(2.) 1.4142135623730951 Utiliser “help(math)” pour avoir la liste des fonctions disponibles. Remarque : pour importer un module (tel que math), il y a deux manières de le faire, avec (a) “import math” ou (b) “from math import *”. Dans le cas (a), les fonctions du module math s’utiliseront en les faisant précéder de “math.” (exemple : “math.sin(math.pi/3.0)”). Dans le cas (b), il n’est pas nécessaire d’utiliser le préfixe, i.e. python comprendra directement “sin(pi/3.0)”. A priori, la première notation n’est à utiliser que si il y a un risque de conflit de noms entre fonctions, si par exemple vous souhaitez redéfinir la fonction sin()... 3.4.3 Nombres complexes Il est possible de manipuler des nombres complexes en Python, le nombre complexe “i” étant noté j : >>> a=2+1j 7 >>> type(a) <type 'complex'> >>> b=3.5+4j >>> print a+b (5.5+5j) >>> print a*b (3+11.5j) Pour utiliser des fonctions mathématiques sur des complexes, il faudra importer le module cmath en plus du module math (voir la section sur l’utilisation de modules), ou bien le module scipy qui inclut également les tableaux. 3.4.4 Chaînes de caractères Outre l’attribution simple (maChaine=Toto), il est possible d”’écrire” une chaîne de caractère (de la même manière qu’avec la fonction printf en langage C), c’est à dire en insérant des codes dans la chaîne (%s pour une chaîne de caractères„ %d pour un entier, %f pour un nombre réel, avec éventuellement le nombre de caractère total et après la virgule : %4.2f veut dire ’nombre réel représenté sur 4 caractères, avec 2 chiffres après la virgule’), suivie de % avec entre parenthèses toutes les variables dont les valeurs sont à insérer : >>> age=5 >>> nom="Vincent" >>> taille=1.73 >>> maChaine="%s a %d ans et mesure %4.2f m"%(nom,age,taille) >>> print maChaine Vincent a 5 ans et mesure 1.73 m Il est possible d’extraire des caractères d’une chaîne : >>> print maChaine[2:6] # extrait les caractères 2 (inclu) à 6 (exclu) ncen Par contre il n’est pas possible de modifier de cette manière une sous-chaîne de caractère : maChaine[2:6]=tapl génère une erreur. Au passage on voit que la numérotation commence à zéro - le premier caractère est maChaine[0]. Il est possible d’additionner des chaînes de caractères : >>> print "Programmation" + " Scientifique" Programmation Scientifique On peut obtenir la longueur d’une chaîne de caractère avec la fonction len(). >>> len("toto") 4 help(str) donne la liste des fonctions utilisables avec des chaînes de caractères. 8 3.4.5 Listes Un type particulièrement intéressant est la liste : >>> x=[1,4,32] >>> print x [1, 4, 32] >>> print type(x) <type 'list'> >>> print x[2] 32 Attention ! On voit ici que la numérotation des objets de la liste commence à 0 (i.e. si il y a n éléments dans liste , ils sont accessibles par liste[0] ...liste[n-1] ). Une liste peut contenir des objets de types différents, contrairement à un tableau : >>> MaListe=[1,"Obélix",57.0] >>> print MaListe[0] 1 >>> print MaListe[1] Obélix >>> print MaListe[2] 57.0 >>> print type(MaListe[0]),type(MaListe[1]),type(MaListe[2]) <type 'int'> <type 'str'> <type 'float'> Il est possible de modifier une liste existante : (le texte après le signe # est un commentaire) MaListe[1]=42 # le 2ème élément de MaListe vaut maintenant 42 MaListe.append(45) # ajoute l'objet 42 à la fin de la liste MaListe.insert(i,x) # insère l'élément x à l'indice i dans MaListe MaListe.reverse() # inverse l'ordre des éléments de la liste MaListe.sort() # trie les éléments de la liste par ordre croissant On peut obtenir la longueur d’une liste (le nombre d’objets dans la liste) avec la fonction len() : len(MaListe). Il est possible de concaténer deux listes avec l’opérateur + : >>> liste1=[1,"ab",3.5] >>> liste2=["toto",57] >>> print liste1+liste2 [1, 'ab', 3.5, 'toto', 57] On peut également supprimer un élément d’une liste avec la fonction del() : >>> MaListe=[1, 'ab', 3.5, 'toto', 57] 9 >>> print MaListe [1, 'ab', 3.5, 'toto', 57] >>> del(MaListe[1]) >>> print MaListe [1, 3.5, 'toto', 57] Pour créer des listes de nombres : >>> range(2,5) # liste des entiers de 2 (inclu) à 5 (exclu) [2, 3, 4] >>> range(5) # liste de 0 (inclu) à 5 (exclu) [0, 1, 2, 3, 4] Les listes sont des objets particulièrement importants. Nous verrons que les boucles utilisent souvent une itération sur des éléments d’une liste. La liste complète des fonctions utilisables pour une liste peut être obtenue avec l’aide help(list). Il existe en particulier une fonction de tri sort() : essayez-la sur une liste de nombres (entiers et réels mélangés). 3.4.6 Vecteurs de nombres C’est un type non élémentaire qui utilise des modules scientifiques (qu’il faut importer au préalable). >>> from pylab import * >>> from numpy import * >>> X=arange(0,6,0.1) # crée un vecteur de nombres xi de 0 à 6 (exclu) par pas de 0.1 >>> print X >>> Y=sin(X) # crée un vecteur où chaque élément est yi = sin (xi ) >>> plot(Y) # dessin des valeurs de Y >>> show() # montre le dessin (il faut ensuite fermer la fenetre pour continuer) Autre possibilitées : >>> X=linspace(0,1,10) # 10 nombres de 0 à 1 compris >>> Y=sin(X) >>> plot(Y,marker='o',linestyle=) # options pour le dessin >>> show() >>> zeros(10) # vecteur de 10 nombres égaux à zéro 3.4.7 Matrices de nombresimporter le m >>> >>> >>> >>> >>> >>> >>> from pylab import * from numpy import * A=zeros([3,3]) # matrice 3 × 3 remplit de zeros A[1,1]=2 # on modifie un élément print A contourf(A) # dessin des contours des valeurs show() 10 >>> B=random.uniform(-1,1,size=(5,5)) # éléments aléatoires dans [−1, 1] >>> contourf(B) >>> show() 3.4.8 Tuple [Facultatif] Un tuple est un objet similaire à une liste, la principale différence étant qu’un tuple ne peut pas être modifié comme une liste. C’est une liste d’objets séparés par des virgules ; on peut (mais ce n’est pas obligatoire) encadrer ces objets par des parenthèses pour mieux délimiter le tuple : >>> monTuple=('a',"toto",54.2) >>> type(monTuple) <type 'tuple'> Il est possible d’extraire un ou plusieurs objets d’un tuple : >>> print monTuple[1] toto >>> print monTuple[1:3] ('toto', 54.200000000000003) >>> a,b,c= monTuple >>> print b toto Par contre il n’est pas possible de modifier un objet dans un tuple (monTuple[1]=tata est une instruction illégale), ou d’ajouter des éléments dans un tuple. En général on ne crée pas explicitement de variable de type tuple, mais ce sont des variables qui aparaissent de manière temporaire, lorsqu’on veut manipuler ensemble plusieurs objets : >>> a,b=5,3 #création de deux variables en une seule ligne >>> print a,b 5 3 >>> a,b=b,a # échange de deux variables >>> print a,b 3 5 3.4.9 Dictionnaires [Facultatif] Un dictionnaire est également un type de liste d’objet, mais au lieu de repérer les objets par un indice commençant à 0, les différents objets sont accessible à l’aide d’une clef, qui peut être un objet quelconque. (pour les personnes familières avec la librairie standard du C++, c’est l’équivalent de std::map<>). >>> fra_deu={"un":"ein","trois":"drei","deux":"zwei"} # Création >>> fra_deu["trois"] # Accès à un élément du dictionnaire 'drei' >>> fra_deu["quatre"] # Clef n'existant pas ! Traceback (most recent call last): 11 File "<stdin>", line 1, in ? KeyError: 'quatre' >>> fra_deu["quatre"]="vier" >>> fra_deu["quatre"] 'vier' # Ajout de l'entrée manquante Vous pouvez obtenir les différentes fonctions disponibles pour un dictionnaire avec la comande help(dict). 3.4.10 Conversion de variables entre différents types On peut convertir une variable d’un type à un autre : >>> x=float(1) # nombre réel à partir d'un entier >>> print type(x) <type 'float'> >>> x=float("1.0") # nombre réel à partir d'une chaîne de caractère >>> print type(x) <type 'float'> >>> print x 1.0 3.5 3.5.1 Boucles et opérateurs opérateurs ==,and, or , not L’opérateur == permet de comparer deux objets : >>> 1==2 # est-ce que 1 est égal à 2 ? False >>> 1==1 True Les autres opérateurs de comparaison sont <, >, <=, >=, != (ce dernier signifie différent). Notez qu’en python tout nombre non nul est interprété comme True, i.e. if(n), où n est un nombre, sera toujours vrai sauf si n est égal à zéro. L’opérateur not(x) renvoie la négation (au sens booléen, vrai/faux) d’une expression : >>> not(True) False >>> not(0) True and et or permettent de réaliser les opérations logiques usuelles (attention il ne s’agit pas d’opérations bit à bit, il ne faut donc utiliser and et or que pour des tests booléens vrai/faux) : >>> 1 and 0 12 0 >>> 1 and 1 1 >>> 1 or 0 1 3.5.2 L’instruction if...elif..else Note : “elif” signifie “else if”. On peut éxécuter une instruction conditonnelle avec if : >>> x=1 >>> if x==2: # est-ce que x est égal à 2 ? ... print "x est égal à 2" # notez les espaces en début de ligne (indentation) ... elif x==3: ... print "x est égal à 3" ... else: ... print "x n'est pas égal à 2" ... print "ni à 3" ... x n'est pas égal à 2 ni à 3 Les espaces en début de ligne (indentation) jouent un rôle important : tant que l’espace reste le même en début de ligne, on reste dans le même “niveau” d’éxécution, de même que dans d’autres langages on utilise des accolades {} pour délimiter les instructions à réaliser. On peut ainsi réaliser des instructions imbriquées en augmentant le niveau d’indentation : >>> x=12 >>> if (x%2)==0: # est-ce que x modulo 2 est égal à 0 ? ... if (x%3)==0: ... if (x%7)==0: ... print "x est multiple de 2,3 et 7 !" ... else: ... print "x est multiple de 2 et 3, mais pas de 7..." ... else: ... print "x est multiple de 2 mais pas de 3" ...else: ... print "x n'est pas multiple de 2" ... x est multiple de 2 et 3, mais pas de 7... 13 3.5.3 La boucle while On peut réaliser une série d’instructions tant qu’une condition est réalisée : >>> x=7 >>> while x>=1: ... print x,">=1 ! On continue..." ... x = x-1 # on pourrait aussi écrire x -= 1 7 >=1 ! On continue... 6 >=1 ! On continue... 5 >=1 ! On continue... 4 >=1 ! On continue... 3 >=1 ! On continue... 2 >=1 ! On continue... 1 >=1 ! On continue... 3.5.4 Les boucles for Une boucle for s’écrit de la manière suivante : >>> for i in [2,3,7]: # De manière générale : for variable in liste: ... print i ... 2 3 7 Comme il est fastidieux d’écrire un grand nombre de valeurs, on peut utiliser la fonction range() qui renvoie une liste d’entiers : >>> range(5) # renvoie une liste de 5 entier en partant de 0 [0, 1, 2, 3, 4] >>> range(2,5) # renvoie une liste d'entiers, de 2 à 5 (exclu) [2, 3, 4] >>> for i in range(2,5): ... print i ... 2 3 4 Note : la fonction range() crée une liste de nombres qui va servir pour l’itération ; on peut s’en servir pour créer une liste sans que cela soit pour une boucle. Pour une boucle, il vaut en fait mieux utiliser la fonction xrange(), qui ne crée pas une ’vraie’ liste en mémoire mais seulement un itérateur sur une liste d’entiers qui permettra à la boucle de se réaliser. 14 3.5.5 Exercice : la conjecture de Syracuse (voir Wikipedia) On considère la suite (un )n définit par récurrence de la façon suivante. u0 ≥ 1 est un entier donné. Si un est pair alors un+1 = un /2, sinon un+1 = 3un + 1. La conjecture de Syracuse est que pour tout entier u0 la suite aboutit à . . . , 4, 2, 1, 4, 2, 1, . . . à partir d’un certain rang. Ecrire une boucle qui, à partir d’un entier u0 , dresse la liste des entiers un suivants jusqu’à ce que 1 soit atteint. Afficher la liste obtenue. 3.6 Fonctions Il est possible d’utiliser des fonctions en Python. Nous avons déjà utilisé print() et type(). De manière générale, une fonction s’utilise de la manière suivante : NomDeLaFonction(paramètres) ou (si la fonction renvoie une valeur) : VariableRenvoyée=NomDeLaFonction(paramètres) Pour définir une nouvelle fonction, il faut utiliser le mot-clef “def” : >>> def MaFonction(nom,age): ... print nom,"a",age,"ans" #noter les espaces en début de ligne ... >>> MaFonction("Obélix",5) Obélix a 5 ans nom et age sont les paramètres de la fonction ; là encore il n’est pas nécessaire de déclarer le type de ces paramètres. En fait on peut très bien utiliser une chaine de caractère pour age : >>> MaFonction("Obélix","cinq") Obélix a cinq ans Par contre si la déclaration de la fonction n’impose pas un contrôle sur les types de paramètres, il faut néanmoins qu’ils soient compatibles pour l’éxécution. Essayer : >>> def Addition(a,b): ... return a+b # Renvoie une valeur avec return ... >>> print Addition(1,2) #deux entiers 3 >>> print Addition(1,3.0) #un entier plus un flottant= un flottant 4.0 >>> print Addition(1,"toto") # entier+chaîne de caractères = erreur ! Traceback (most recent call last): File "<stdin>", line 1, in ? File "<stdin>", line 2, in Addition TypeError: unsupported operand type(s) for +: 'int' and 'str' >>> print Addition("tata","toto") # deux chaînes de caractères tatatoto 15 Note : comme pour les boucles c’est l’indentation (le nombre d’espaces en début de ligne) qui définit quelles sont les instructions qui font partie de la fonction. Cela remplace l’utilisation d’accolades {} dans d’autres langages. Exercice : réutiliser le code écrit pour la suite de Syracuse ci-dessus : Ecrire une fonction appelée suite qui prend comme argument u0 et renvoit la suite de Syracuse jusqu’à ce que 1 soit atteint. Ecrire une autre fonction appelée longueur utilisant la précédente fonction, qui renvoit dans une liste la longueur des suites obtenues pour u0 variant de 1 à 100. 3.7 Portée des objets : variables locales et globales En python, les variables sont locales (par défaut), ce qui signifie qu’elles n’existent qu’au niveau où elles ont été définies. Exemple : >>> x=12.3 # Première variable x >>> def fonction1(): ... x=1 # Deuxième variable x ... print x ... >>> def fonction2(): ... x="Toto" # Troisième variable x ... print x ... >>> print x 12.3 >>> fonction1() 1 >>> fonction2() Toto Dans l’exemple ci-dessus, les 3 variables ont le même nom mais sont complètement indépendantes. On dit qu’elles sont locales. Il est à noter qu’un niveau d’indentation ne peut pas modifier les variables du niveau au-dessus (contrairement à ce qui se passe en C/C++). Essayer par exemple : >>> compte=0 >>> def compteur(): ... print compte ... compte+=1 ... return compte ... >>> compteur() 0 16 Traceback (most recent call last): File "<stdin>", line 1, in ? File "<stdin>", line 2, in compteur UnboundLocalError: local variable 'compte' referenced before assignment Par contre, il est parfaitement possible de lire la variable compte, sans la modifier. Pour pouvoir utiliser une variable à différents endoits (autrement qu’en la passant comme paramètre à une fonction), il faut utiliser le mot-clef global : >>> compte=0 >>> def compteur(): ... global compte ... compte+=1 ... return compte ... >>> compteur() 1 Note : en général, il vaut mieux éviter d’utiliser des variables globales, en passant des variables par paramètre aux fonctions. 3.8 Exercice Ecrire une fonction qui prend comme argument deux listes représentant des positions atomiques dans l’espace (e.g. [”C1”, 0, 0.5 , 0.7]), et qui renvoie leur distance interatomique avec une ligne du type : “La distance entre l’atome C1 et l’atome H3 est de 3.5 A” 4 4.1 Classes et Objets Présentation Historiquement se sont succédées plusieurs manières de programmer : Dans l’approche procédurale, un seul programme exécute séquentiellement une suite d’instructions. Ce fonctionnement convenait bien à des programmes courts, écrits par une seule personne . Avec des programmes plus longs (et l’intervention de plusieurs personnes, en parallèle ou se suivant dans le temps), il est devenu nécessaire de séparer les différentes tâches du programme avec plusieurs fonctions : c’est l’approche structurée. 17 L’approche la plus moderne est la Programmation Orientée Objet (POO) : les données traitées dans le programme sont stockée dans des “objets”, qui comprennent à la fois les données ainsi que des fonctions qui servent à utiliser l’objet. Par exemple un objet Molécule pourra contenir une liste d’atome, leurs positions, mais également des fonctions pour calculer l’énergie, la charge totale, le moment dipolaire, ... de la molécule. En outre on peut créer des hiérarchies d’objets, qui “héritent” des propriétés de leur ancêtres, etc... Attention : bien que la programmation Objet soit la plus moderne des approches, les deux autres restent parfaitement valables, en particulier pour de petits projets. Rien ne sert de créer des objets pour des calculs ne prenant que quelques lignes ! ! ! 4.2 Exemple Construisons par exemple une classe d’objets de type “polygone” : >>> class Polygone: # Déclaration de la classe ... circ=1.0 # Une variable membre de la classe, pour stocker la circonférence ... def Circonference(self): # fonction renvoyant la valeur de la circonférence ... return self.circ ... >>> a=Polygone() # Création d'un objet de type Polygone >>> print a.circ # Que vaut sa circonférence (accès direct) ? 1.0 >>> print a.Circonference() # Que vaut sa circonférence (par la fonction) ? 1.0 >>> a.circ=12.3 # Modification de la circonférence >>> print a.Circonference() # Vérification de la modification 12.3 Dans la déclaration ci-dessus, on voit aparaître le mot-clef “self” : c’est ce qui désigne, dans le corps de la classe, l’objet lui-même. Par exemple, “self.circ” veut dire “la variable circ dans l’objet Polygone où le code est exécuté” (si on est dans le Polygone “a”, cela sera a.circ). 4.3 Variables membre Une variable stockée dans un objet, comme la variable “circ” ci-dessus. Il peut y en avoir autant que l’on veut. Il est même possible (contrairement au C++) d’ajouter des variables membres après avoir déclaré une classe : à la suite du code ci-dessus, essayer : >>> Polygone.surface=45.6 # Ajout de la variable membre 'surface' >>> b=Polygone() >>> print b.circ,b.surface,a.circ,a.surface 1.0 45.6 12.3 45.6 18 La variable membre est accessible dans tous les objets Polygone, même “a” qui a été créé avant. 4.4 Fonctions membres Une fonction membre est une fonction qui est définie dans la déclaration de la classe, et a accès aux attributs de la classe, comme la fonction Circonférence(self) définie dans l’objet Polygone. Elle prend au moins un argument, “self”, qui désigne l’objet lui-même (c’est l’équivalent du pointeur this en C++) et permet à la fonction d’accéder aux attributs. Là encore, on peut utiliser autant de fonctions membre que nécessaire. Dans une fonction membre, il est très important de distinguer les variables membre (celles précédées de “self.”) des variables locales. Les variables membres sont les seules qui ne sont pas détruites à la fin de l’éxécution d’une fonction membre et qui permettent de ’stocker’ des informations dans l’objet, et donc de les passer de fonction en fonction. >>> class Objet: ... var1=1.0 # variable membre déclarée à la base de la classe ... def __init__(self): # Constructeur ... varlocale=1.0 # Variable locale ... self.var1=2.4 # Changement de la valeur de la variable membre self.var1 ... self.var2="toto" # Ajout d'une seconde variable membre self.var2 ... def Fonction1(self): ... print self.var1,self.var2 ... varlocale="tata" # Cette variable est locale ... >>> a=Objet() >>> a.var1 2.3999999999999999 >>> a.var2 'toto' >>> a.Fonction1() 2.4 toto >>> a.varlocale # erreur car varlocale n'est pas une variable membre Traceback (most recent call last): File "<stdin>", line 1, in ? AttributeError: Objet instance has no attribute 'varlocale' Pour chaque objet, il faut avoir le réflexe “self .nomVariable”, de manière à systématiquement distinguer les variables membre des variables locales. 19 4.5 Fonctions membres spéciales [Facultatif] Certaines fonctions membre sont prédéfinies dans python car elles permettent d’effectuer des opérations prédéfinies. Le nom de ces fonctions commence et finit par deux traits soulignés. 4.5.1 Constructeur __init__ Un constructeur est une fonction membre d’un type spécial, qui sert à initialiser un nouvel objet, en général en utilisant des arguments : >>> class Polygone: ... circ=1.0 ... def __init__(self,circ0): # Prend comme argument la circonférence initiale ... self.circ=circ0 # Initialise la circonférence .. def Circonference(self): ... return self.circ ... >>> a=Polygone(10.5) # Crée un polygone de circonférence 10.5 >>> print a.Circonference() 10.5 4.5.2 Destructeur __del__ Le destructeur est la fonction qui est appelée lors de la destruction de l’objet. Il ne prend qu’un argument (self). Il peut servir à ’nettoyer’ des données créées par l’objet. 4.5.3 Opérateurs __add__, __sub__, __mul__, __div__, __pow__ Ce sont les opérateurs (+, -, *, /, **) qui permettent des opérations arithmétiques. Ils prennent deux arguments, self et un argument désignat le second membre de l’opération : >>> class Polygone: ... circ=1.0 ... def __add__(self,poly): # addition ... somme=Polygone() # objet à renvoyer ... somme.circ=self.circ+poly.circ ... return somme ... >>> a=Polygone() >>> b=Polygone() >>> b.circ=3.5 >>> print (a+b).circ # Circonférence de la somme de a et b 4.5 Redéfinir ces opérateurs standard peut être intéressant. 20 4.6 Héritage [Facultatif] L’héritage permet de créer des classes qui héritent tout ou partie des propriétés de la ou les classes parentes. On peut ainsi dériver une classe rectangle de la classe Polygone : >>> class Polygone: ... def __init__(self,circ0=2.1): # On utilise ici un argument par défaut ... self.circ=circ0 ... def Circonference(self): ... return self.circ ... >>> class Rectangle(Polygone): # Hérite de la classe Polygone ... def __init__(self,x0=2.5,y0=3.5): ... self.x=x0 ... self.y=y0 ... self.circ=2.0*(x0+y0) ... >>> a=Rectangle(3.0,4.0) >>> print a.Circonference() # La fonction est héritée de Polygone 14.0 Il est possible de dériver une autre classe, et également de remplacer la fonction Circonference() de la classe de base par une nouvelle fonction : >>> class Carre(Rectangle): # Hérite de la classe Rectangle ... def __init__(self,x0): ... self.x=x0 ... def Circonference(self): # On réécrit la fonction Circonference() ... return 4*self.x ... >>> a=Carre(4.0) # Carré de coté 4.0 >>> print a.Circonference() 16.0 L’héritage peut être très utile lorsque l’on génère de multiples classes ayant des propriétés similaires. Par contre il ne faut pas en abuser, cela peut amener à une programmation inutilement complexe ! Ce n’est en général utile que pour des projets de taille suffisament grande (> 1000 lignes), mais cela peut être aussi utile pour ré-utiliser du code (provenant par exemple d’une librairie développée par quelqu’un d’autre), en ajoutant quelques fonctions à une classe préexistante. 4.7 Attention : opérateur “==”, différence entre égalité et identité, copie et référence... [Facultatif] Utilisons les classes définies précédemment, et essayons de comparer des objets : 21 >>> a=Carre(4.0) >>> b=Carre(4.0) >>> c=a >>> print a==b, a==c, b==c False True False Que s’est-il passé ? Clairement les trois carrés sont égaux et on s’attendrait à lire True True True comme réponse... En fait l’opérateur == n’a pas comparé les valeurs (est-ce que les carrés sont égaux), mais les adresses, pour tester l’identité des carrés. Ce qui se comprend mieux si on teste le code suivant : >>> print a.x,c.x 4.0 4.0 >>> c.x=5.7 >>> print a.x,c.x 5.7 5.7 Ce qui se passe donc lorsqu’on écrit “c=a” n’est pas la création d’un nouveau carré distinct de a, mais un carré dont l’attribut “x” pointe vers la même case mémoire que celle de a... Ce qui fait que c et a représentent rigoureusement le même objet. L’idée derrière ce comportement qui peut souvent induire en erreur est de minimiser l’espace mémoire en faisant par défaut un passage par référence (i.e. en pointant la nouvelle variable vers la même case que la variable originelle) plutôt qu’une copie. Afin d’éviter cela, il est possible d’effectuer une véritable copie avec la fonction copy.copy() ou copy.deepcopy() : >>> import copy >>> a=Carre(4.0) >>> b=Carre(4.0) >>> c=copy.copy(a) # en fait il vaut mieux utiliser c=copy.deepcopy(a) >>> print a==b, a==c, b==c False False False 4.8 Exercice Créer une classe Atome qui a 4 attributs : le nom, et les 3 coordonnées x,y,z, avec des fonctions permettant de créer la classe, et d’accéder aux 4 attributs (Nom(), X(), Y() Z()). Créer une fonction calculant la distance entre deux atomes. Ensuite créer une classe Molécule, qui a comme attribut une liste d’atomes, et qui a des fonctions membre permettant de : — Ajouter un atome — Accéder à un des atomes — Afficher la liste de toutes les distances interatomiques dans la molécule. 22 5 Lecture et écriture de fichiers On crée un objet fichier Python avec la fonction open() : >>> MonFichier = open(NomDuFichier,'r') Le mode peut être ’r’ (read, en lecture seule), ’w’ (en écriture seule), ’a’ pour rajouter à la fin du fichier, ... D’autres modes (mixte lexture/écriture, etc...) existent. La lecture des fichiers texte (i.e. non binaires) se fait avec les fonctions read(), readline() et readlines() : >>> MonFichier.read() # Lit la totalité du fichier sous forme d'un chaîne de caractères >>> MonFichier.readline() # Lit la ligne suivante du fichier, sous forme d'une chaîne de caractères >>> MonFichier.readlines() # Lit toutes les lignes du fichier sous forme d'une liste de chaînes de caractères >>> Monfichier.write('toto') # écrit Pour lire une liste de nombres contenu dans une ligne, il suffit de lire cette ligne avec la fonction readline(), puis de séparer les nombres avec la fonction split(). Par exemple : >>> f=open("tmp0",'r') >>> ligne=f.readline() # lecture d'une ligne >>> print ligne # Ecriture de la ligne sous forme d'une chaîne de caractères Toto 1.8 9.2 >>> print ligne.split() # On sépare les éléments -> liste ['Toto', '0.2', '9.2'] >>> print float(ligne.split()[1]) # Conversion en nombre réel 0.2 >>> f.close() # referme le fichier help(file) permet de lister l’aide sur l’utilisation des fichiers. Ecriture/Lecture de données formatées : On utilise le module pickle. Cela permet d’écrire des données et lire des données en conservant leur type (nombre, liste, chaine de caractère etc...). Pour écrire : >>> import pickle >>> x=2 >>> f=open("fichier",'w') >>> pickle.dump(x,f) #écrit x >>> f.close() Pour relire : >>> f=open("fichier",'r') >>> x=pickle.load(f) #lit x >>> f.close() >>> print x 23 2 5.1 Exercice Créez un fichier avec une liste d’atomes (un nom et 3 coordonnées par ligne). Rajoutez une fonction LireFichier(self, NomFichier) dans votre classe Molecule, qui lit la liste des atomes. Et ensuite listez toutes les distances interatomiques... Ensuite, ajouter une fonction qui peut écrire dans un fichier la liste des atomes... et vérifiez que vous arrivez à la relire ensuite ! Deuxième partie Modules scientifiques 6 Utilisation de “modules” (standards et librairies extérieures) Pour importer un module, il faut utiliser la commande “import NomDuModule ”. Il est alors possible d’obtenir une aide sur le module avec la commande “help(NomDuModule )”. Les fonctions s’utilisent sous la forme “NomDuModule .NomDeLaFonction (paramètres )”. Il est également possible d’importer le contenu du module sous la forme “from NomDuModule import *” et alors les fonctions peuvent être utilisées directement par “NomDeLaFonction(paramètres)”. 6.1 math Ce module standard comporte toutes les fonctions mathématiques usuelles : >>> import math >>> print math.sin(math.pi/4) 0.707106781187 >>> print math.log(10.0) 2.30258509299 ou : >>> from math import * >>> print sin(pi/4) 0.707106781187 >>> print log(10.0) 2.30258509299 Pour utiliser des fonctions mathématiques sur des complexes, il faudra importer le module cmath en plus du module math. Néanmoins en général il est plus simple d’utiliser directement 24 scipy, qui inclut toutes les fonctions de math et cmath, et permet également de les utiliser sur des tableaux. 6.2 Scipy (scientific python, http ://www.scipy.org) Ce module ne fait pas partie par défaut de Python mais est en général présent, ou peut être obtenu à partir de l’adresse http ://www.scipy.org. Ce module permet en particulier d’effectuer des calculs sur des tableaux : >>> from scipy import * >>> a=zeros([2,5],floating) # un tableau de 2 lignes et 5 colonnes >>> print a # rempli de 0.0 (nombres réels) [[ 0. 0. 0. 0. 0.] [ 0. 0. 0. 0. 0.]] >>> a[1,3]=4.0 # Modification d'un élément >>> print a [[ 0. 0. 0. 0. 0.] [ 0. 0. 0. 4. 0.]] >>> a[0,:]=1.0 # Modification de la première ligne >>> print a [[ 1. 1. 1. 1. 1.] [ 0. 0. 0. 4. 0.]] >>> print a[:,3] # Affichage de la quatrième colonne [ 1. 4.] >>> sin(a) array([[ 0.84147098, 0.84147098, 0.84147098, 0.84147098, 0.84147098], [ 0. , 0. , 0. , -0.7568025 , 0. ]]) Attention sur la dernière ligne on utilise une fonction sin(), qui provient du module scipy. Si les deux modules (math et scipy) étaient importés avec “from NomDuModule import *”, il y aurait une ambiguité sur quelle fonction sin() à utiliser... En fait la dernière fonction sin() importée écraserait la précédente... Dans ces cas là, n’utiliser que “import NomDuModule” et ensuite math.sin() et scipy.sin() suivant la fonction désirée. On peut même n’importer qu’une fonction d’un module, par exemple avec “from math import sin”. Lire l’aide de scipy pour voir les différentes fonctions disponibles. En particulier, on peut créer des tableaux avec les fonctions ones, zeros , et en utilisant comme type : complex64, complex128, float32, float64, int16, int32, int64, suivant le type de donnée et la précision souhaitée. 6.2.1 Exemples Commencer par le didacticiel de scipy, consacré aux manipulations algébriques de matrics, qui se trouve à : 25 http://www.scipy.org/SciPy_Tutorial Essayer “Example 1”, “Example 2” et “Numerical integration”. Regarder des petits exercices dans le cookbook de scipy : http://www.scipy.org/Cookbook En particulier “linear regression”, “optimization”, “smoothing a signal” Des petits exemples d’utilisation de fonctions scipy peuvent être trouvé à : http://www.scipy.org/Numpy_Example_List 6.2.2 Sous-modules de scipy Scipy est un ensemble qui comprend de nombreux modules utiles pour des scientifiques : * cluster : information theory functions (currently, vq and kmeans) * weave : compilation of numeric expressions to C++ for fast execution * fftpack : fast Fourier transform module based on fftpack and fftw when available * ga : genetic algorithms * io : reading and writing numeric arrays, MATLAB .mat, and Matrix Market .mtx files * integrate : numeric integration for bounded and unbounded ranges. ODE solvers. * interpolate : interpolation of values from a sample data set. * optimize : constrained and unconstrained optimization methods and root-finding algorithms * signal : signal processing (1-D and 2-D filtering, filter design, LTI systems, etc.) * special : special function types (bessel, gamma, airy, etc.) * stats : statistical functions (stdev, var, mean, etc.) * linalg : linear algebra and BLAS routines based on the ATLAS implementation of LAPACK * sparse : Some sparse matrix support. LU factorization and solving Sparse linear systems. Là encore, de la documentation est disponible (après import du module) avec la commande “help(NomDuModule)” Par exemple le module FFTPACK : >>> import scipy >>> from scipy import fftpack >>> a=scipy.array(range(20),scipy.floating) >>> print a [ 0. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19.] >>> print scipy.fftpack.fft(a) [ 190. +0.j -10.+63.13751515j -10.+30.77683537j -10.+19.62610506j -10.+13.7638192j -10.+10.j -10. +7.26542528j -10. +5.09525449j -10. +3.24919696j -10. +1.5838444j -10. +0.j -10. -1.5838444j -10. -3.24919696j -10. -5.09525449j -10. -7.26542528j -10.-10.j -10.-13.7638192j -10.-19.62610506j 26 -10.-30.77683537j -10.-63.13751515j] 6.2.3 Extensions ou applications de scipy Se référer à : http ://www.scipy.org/Topical_Software 6.3 Tracé de données scientifiques (1D, 2D) avec matplotlib/pylab Le tracé de toutes les courbes “scientifiques” se fait à l’aide de matplotlib, qui est une librairie dont les commandes sont similaires à matlab. Pour l’utiliser, il faut importer le module “pylab” (rcommandé) ou matplotlib. Si on utilise ipython, le plus simple est de démarrer ipython avec l’option -pylab, i.e. : “ipython -pylab” 1 . Cela importe tout le module et permet de travailler en mode “interactif”, ç’est-à-dire que la figure s’affiche au fur et à mesure qu’on tape les instructions de tracé (plutôt que de ne voir la figure qu’à la fin). La référence complète de matplotlib est lisible à l’adresse : http ://matplotlib.sourceforge.net/matplotlib.pylab.html Regarder la section Il est en particulier recommandé de regarder les “screenshots”, qui sont donnés avec le code utilisé pour les générer. 6.3.1 Courbe 1D Pour tracer une sinusoïde : x=linspace(-5,5,101) # coordonnées de -5 à 5 avec 101 valeurs y=sin(x) plot(x,y) # Tracé de la courbe ! On obtient une courbe sur laquelle on peut zoomer, modifier les marges, et sauvegarder dans différents formats (jpg, png, eps...) On peut rajouter un titre, une légende, du texte avec les fonctions title(), legend() et text(). Voir les documentations de ces fonctions soit sur le site web de matplotlib, soit en utilisant “?” après le nom de la fonction dans ipython. Pour tracer plusieurs courbes, on peut les mettre les unes à la suite des autres, par exemple : plot(x,y,"r-",x,cos(x),"g.") “r-” indique que la première courbe est à tracer en rouge avec des traits, et “g.” que la deuxième est à tracer en vers avec des points. Voir l’aide de plot() pour connaître les autres options de ce tracé. 1. Pour les utilisateurs de windows, il faut soit modifier le raccourci permettant de lancer ipython (en ajoutant “-pylab” à sa suite), soit copier ce raccourci dans une console, toujours pour ajouter l’option “ -pylab” à la fin. 27 6.3.2 Courbe 2D Pour cela on utilise imshow(z) ou pcolor(x,y,z). x=linspace(-5,5,201) y=linspace(-7,7,201)[:,newaxis] # newaxis indique que ce vecteur est selon la 2ème dimension z=sin(x**2+y**2) imshow(z) # Affiche l'image en 2D imshow(z,extent=(x.min(),x.max(),y.min(),y.max())) # On précise les coordonnées des axes jet() # Pour avoir une plus jolie table de couleurs L’inconvénient de imshow est que cette fonction suppose que le tableau 2D affiché (z) correspond à des coordonnées régulières en x et y, ce qui n’est pas forcément le cas. Pour cela on utilise pcolor, mais x,y,z doivent alors tous être des tableaux 2D ! Par exemple : x=linspace(-5,5,201) y=linspace(-7,7,201)[:,newaxis] x=x+y*0.4 # transforme x en tableau 2D y=y+x*0 z=sin(x**2+y**2) #imshow(z,extent=(x.min(),x.max(),y.min(),y.max())) # Représentation non correcte, inclinée clf() # Efface la figure avant un nouveau tracé (si on affiche plusieurs figures à la suite) pcolor(x,y,z,shading='flat') # effectue le tracé 6.4 Autres modules scientifiques PyMol et cctbx : pour la cristallographie (en particulier des protéines) PyQuante : Chimie Quantique Snack : pour le traitement du signal pyVTK et Mayavi, OpenDX : pour la représentation graphique en 3D etc... Une majeure partie des librairies de calcul développées en fortran ou en C/C++ sont ainsi disponibles en Python (voir plus bas comment créer une interface avec python grâce à Boost.Python ou SWIG) Une liste (très incomplète) de modules disponibles pour Python est disponible sur le site web consacré au language (http ://www.python.org/pypi ; http ://www.python.org/moin/NumericAndScientific). De nombreux modules peuvent également se trouver à partir du site Sourceforge (en cherchant dans les projets utilisant python comme langage : http ://sourceforge.net/softwaremap/trove_list.php ?form_cat= Mais le meilleur moyen de savoir si un outil particulier a été développé en Python est encore d’utiliser Google ! 28 De nombreux laboratoires utilisent et développent des outils à base de Python pour le calcul scientifique, à Grenoble (ILL, ESRF, CEA, CNRS) et ailleurs (en particulier le Laboratoire Lawrence Livermore LLNL, le CERN). 7 Performance et interface C/C++ <-> Python [Facultatif] 7.1 Performance : C/C++ vs Python Etant un langage interprété, Python présente des perfomances en terme de calcul assez médiocres si on ne prend pas garde à la méthode utilisée. Par exemple pour une simple opération d’addition de 2 tableaux de 100 000 éléments, on peut calculer le nombre d’opérations par seconde : # -*- coding: iso-8859-15 -*import scipy import time # Module de fonction sur le temps (date, heure) taille=100000 # 1ère version avec une boucle en Python nbiter=10 a=range(taille) # Avec une boucle b=range(taille) c=range(taille) t1=time.time() # time.time() renvoie le nombre de secondes écoulées for i in xrange(nbiter): for i in xrange(taille): c[i]=a[i]+b[i] t2=time.time() print "Boucle : %6.3f Mflops"%( (taille*nbiter)/(t2-t1)/1e6) # 2ème version vectorisée à l’aide d’un tableau nbiter=1000 a=scipy.ones(taille) # Avec des tableaux b=scipy.ones(taille) c=scipy.ones(taille) t1=time.time() for i in xrange(nbiter): c=a+b t2=time.time() print "Tableau : %6.3f Mflops"%( (taille*nbiter)/(t2-t1)/1e6) 29 La différence de temps d’éxécution est très nette, plus qu’un facteur 50 ! Si on compare avec un programme en c++ (compiler en utilisant “g++ vite.cpp -o vite” et éxécuter le programme vite avec “./vite”) : # 3ème version en c++ #include <stdlib.h> #include <time.h> #include <iostream> using namespace std; int main() { const unsigned long taille=100000; const unsigned long nbiter=1000; long *a=new long[taille]; long *b=new long[taille]; long *c=new long[taille]; clock_t time0=clock(); for(unsigned long i=0;i<nbiter;i++) { long *pa=a; long *pb=b; long *pc=c; for(unsigned long j=0;j<taille;j++) *pc++ = *pa++ + *pb++; } clock_t time1=clock(); const float seconds=(float)(time1-time0)/(float)CLOCKS_PER_SEC; cout <<"C++ : "<< (float)taille * (float)nbiter/ seconds /1e6<<endl; delete[]a; delete[]b; delete[]c; } La différence reste importante avec Python (facteur 2 par rapport au calcul vectorisé), mais sans être trop gênante pour des calculs pas trop longs (<1h). Ce d’autant que la version en c++ est deux fois plus longue, et utilise des pointeurs qui sont une source fréquente d’erreurs de programmation. 7.1.1 Utilisation de scipy.weave Pour une petite partie de calcul qui doit être exécutée très rapidement, il est possible d’insérer du code C++ à l’intérieur d’un programme Python - cette partie du code est alors compilée automatiquement, est peut accélérer considérablement certaines opérations. Pour cela il faut importer 30 scipy et le sous-module scipy.weave - pour insérer du code de type C++ il faut alors utiliser la fonction scipy.weave.inline. L’exemple ci-dessus devient alors : # -*- coding: iso-8859-15 -*import scipy from scipy import weave import scipy nbiter=1000 a=scipy.ones(taille) b=scipy.ones(taille) c=scipy.ones(taille) def testweave(): code=""" for(unsigned int ct=0;ct<nbiter;++ct) { const double *pa=a.data(); const double *pb=b.data(); double *pc=c.data(); for(unsigned int i=0;i<taille;++i) *pc++ = *pa++ + *pb++; } """ err = weave.inline(code,['a', 'b', 'c', 'taille', 'nbiter'], type_converters=weave.converters.blitz, compiler = 'gcc') testweave() # Le premier appel est long, car le code est alors compilé ! nbiter=1000 t1=time.time() testweave() # On recommence, en utilisant les code pré-compilé t2=time.time() print "SciPy.weave : %6.3f Mflops"%( (taille*nbiter)/(t2-t1)/1e6) 7.2 Interface C/C++ <-> Python avec SWIG Lorsque des calculs longs (soit intrinsèquement, soit parce qu’il sont répétés) sont nécessaires, il vaut mieux sous-traiter les calculs à un langage plus performant (en pratique C++ ou fortran), tout en organisant le programme (entrées/sorties, représentation des données, interface utilisateur etc...) en Python. Lorsqu’aucune librairie proposant ce calcul n’est disponible sous Python (cela devient de plus en plus rare ! Un outil essentiel du programmateur scientifique est aujourd’hui Google !), il peut être nécessaire de créer cette interface (et éventuellement le programme en C+C++/fortran). Il existe pour cela des programmes spécialisés, les plus utiles aujourd’hui étant Boost.Python (http ://www.boost.org/libs/python/doc/index.html) et SWIG (http ://www.swig.org/ ). Nous allons présenter (très) rapidement ce dernier. 31 Séparer le petit programme en C++ ci-dessus en 2 fichiers : — le fichier d’en-tête test1.h qui ne comprend qu’une seule ligne de déclaration “void FonctionTest(long taille,long nbiter);” — le ficher de code test1.cpp qui contient le même code que la fonction ci-dessus, en remplaçant la fonction main() par une fonction FonctionTest() prenant comme argument le nombre d’éléments et le nombre d’itérations à effectuer. Ensuite créer un fichier d’interface “test1.i” qui définira les éléments à partager entre SWIG et Python : %module test1 %{ #include "test1.h" %} extern void FonctionTest(long,long); Enfin, compiler et créer l’inteface avec SWIG avec : swig -python -module test1.i # crée test1_wrap.c g++ -c test1_wrap.cxx test1.cpp -I /usr/include/python2.3/ g++ -shared test1_wrap.o test1.o -o _test1.so # crée _test1.so Ensuite il n’y a plus qu’à tester dans l’interpréteur Python : >>> import test1 >>> help(test1) >>> test1.FonctionTest(100000,100) C++ : 4.54545e+07 Bien sûr ce travail d’interface peut être complexe, donc le réserver aux calculs réellements intenses. Rien ne sert de passer plus de temps à écrire un programme que vous n’en passerez à l’utiliser ! 8 Fenêtres et graphiques avec wxPython wxPython (http ://wxpython.org) est une librairie graphique très générale, multi-plateforme. Elle est écrite en c++ (wxWidgets, anciennement appelée wxWindows http ://wxwidgets.org), et permet de créer des fenêtre avec des graphiques 2D, 3D, des boutons/contrôles, la communication avec d’autres ordinateurs (sockets), les exécutions en parallèle (threads), etc... Elle est donc assez complexe, nous n’en présenterons ici qu’une très petite partie ! De manière générale lorsqu’on crée une application avec des calculs et un affichage graphique, il faut savoir que plusieurs “fils” (threads) doivent s’éxécuter en parallèle : l’un pour gérer le graphisme (retracer une fenêtre si elle a été effacée par une autre passant devant, par exemple), l’autre pour les calcul (ou pour lire les commandes tapées sur la console). Pour travailler dans ce mode multi-fil (multi-thread), il faut lancer ipython avec l’option wthread “ipython -wthread”. 32 8.1 Animation : corde pendante Voici un petit exemple d’animation - on crée une fenêtre, qui possède une fonction “OnPaint” dans laquelle est défini tout ce qui doit être dessiné. Un objet wxTimer est utiliser pour demander régulièrement à la fenêtre d’être redessinée. import wx from wxPython.wx import * import time from math import cos TIMER_ID = wxNewId() class Fenetre(wxPanel): def __init__(self, parent): wxPanel.__init__(self, parent, -1) wx.EVT_PAINT(self, self.OnPaint) self.t0=time.time() wx.EVT_TIMER(self, TIMER_ID, self.OnPaint) def OnPaint(self, event=None): dc = wxPaintDC(self) dc.Clear() dc.SetPen(wx.Pen("BLACK", 4)) angle=0.2*cos(time.time()-self.t0) dc.DrawLine(50, 0, 50+100*sin(angle), 100*cos(angle)) app=wxPySimpleApp() cadre = wxFrame(None, -1, "Mon cadre !") fenetre=Fenetre(cadre) cadre.Show(True) t = wxTimer(fenetre, TIMER_ID) t.Start(200) #app.MainLoop() #Pour laisser la main à l'application plutôt qu'à la ligne de commande En commentant la dernière ligne app.MainLoop(), on peut continuer à utiliser la ligne de commande pour taper des instructions. Essayez par exemple “fenetre.t0+=1” pour voir le pendule faire un bon dans le temps. Pour réaliser d’autres graphiques qu’un seimple pendule, il faut utiliser d’autres fonctions de wxPaintDC - regarder pour cela la référence de wxDC à : http ://wxwidgets.org/manuals/2.6/wx_classref.html En particulier DrawCircle, DrawArc, DrawText,... 33 8.2 Animation et calcul Si on souhaite en même temps effectuer des calculs et avoir un affichage graphique, cela se complique car un seul fil du programme peut s’éxécuter à la fois. Par exemple si on sépare le calcul et l’affichage du pendule : Ajouter à la fin du programme précédent une boucle de calcul (ou la taper à la console) : for i in xrange(10): print i time.sleep(1) # Attend 1 seconde Le pendule cesse de s’afficher ! Parce que tant que la boucle ci-dessus n’est pas terminée, elle monopolise l’ordinateur... Dès que la boucle est finie, l’affichage reprend. Pour permettre au graphique de se tracer, il suffit de temps à autres de premettre au “fil graphique” de travailler lui aussi. Il suffit pour cela d’insérer l’instruction wxYield() au milieu de la boucle de calcul : for i in xrange(10): time.sleep(1) # Attend 1 seconde wxYield() Par contre cette méthode ne marche pas toujours, car lorsque wxYield est appelé rien ne garanti que le temps laissé serve au fil d’éxécution graphique... Plutôt que d’utiliser un wxTimer qui demande périodiquement un rafraichissement de l’affichage, il vaut mieux commander cet affichage de la boucle de calcul avec wxPostEvent() suivi de wxYield() : import wx from wxPython.wx import * import time from math import cos,sin class Fenetre(wxPanel): def __init__(self, parent): wxPanel.__init__(self, parent, -1) wx.EVT_PAINT(self, self.OnPaint) self.t0=time.time() def OnPaint(self, event=None): dc = wxPaintDC(self) dc.Clear() dc.SetPen(wx.Pen("BLACK", 4)) angle=0.2*cos(time.time()-self.t0) x,y=50+100*sin(angle),100*cos(angle) dc.DrawLine(50, 0, x, y) dc.DrawCircle(x, y,20) app=wxPySimpleApp() cadre = wxFrame(None, -1, "Mon cadre !") 34 fenetre=Fenetre(cadre) cadre.Show(True) #Boucle de "calcul" for i in xrange(100): print i time.sleep(0.05) #Mettre ici le calcul wxPostEvent(fenetre,wxPaintEvent()) # Demande un nouvel affichage wxYield() # Laisse du temps à l'affichage 35