TP Python SRI 1

Téléchargement

TP Python SRI 1

September 13, 2016

1 Programmation en Python — SRI 2015/2016 — TP 1

1.1 Environnement de travail

Vous ˆetes libres d’utiliser l’´editeur de votre choix pour ´ecrire vos programmes, et vous pouvez lancer votre

programme avec l’interpr´eteur python `a partir du terminal, par exemple˜:

python -i monprog.py argument1 argument2 ...

Si votre programme attend des arguments (cf exemple ci-dessous), et avec l’option -i pour pouvoir rester

dans l’interpr´eteur et faire diﬀ´erents tests.

Mais il vaut mieux utiliser l’environnement de d´eveloppement install´e sur votre machine: spyder. Cela

vous fournit ´editeur/environnement d’´ex´ecution/d´ebuggueur/inspection du programme et aide `a la demande.

Vous avez l’´editeur `a gauche, l’interpr´eteur en bas `a droite, et diﬀ´erentes aides en haut `a droite.

V´eriﬁer dans le menu Aﬃchage/Volets que vous avez bien activ´e l’inspecteur d’objets et l’inspecteur de

variables.

Pour r´ecup´erer des arguments d’un programme lanc´e depuis le terminal, vous pouvez utiliser le module

sys

sys.argv est alors une liste contenant tous les arguments de l’interpr´eteur (y compris le nom du programme

lanc´e).

Vous pouvez donner des arguments au programme `a l’ex´ecution dans Spyder en allant dans le menu

“Execution/Conﬁgurer”

In [7]: import sys

print sys.argv[0]

/Users/iarf/anaconda/lib/python2.7/site-packages/IPython/kernel/ main .py

1.1.1 NB: N’h´esitez pas `a r´eutiliser des fonctions d’une partie `a l’autre !

1.2 Analyse de texte : listes, dictionnaires, ensembles

Aﬁn de gagner en familiarit´e avec les structures de donn´ees Python les plus utiles, vous allez d´evelopper des

fonctions pour analyser le vocabulaire utilis´e dans un texte. Vous trouverez sur ma page une version d’Alice

aux pays des merveilles, mais vous pouvez r´ecup´erer le texte de votre choix. J’ai choisi un texte an anglais

pour simpliﬁer les probl`emes d’accents.

http://www.irit.fr/˜Philippe.Muller/alice wonderland.utf8.txt

Premi`ere approche simple D´eﬁnissez un ensemble de fonctions pour lire un texte d’un ﬁchier, et compter

le nombre d’occurrence de chaque mot. Il faudra bien sˆur g´erer la ponctuation, entre autres. Le but est de

sortir les mots les plus int´eressants utilis´es dans l’oeuvre consid´er´ee.

Texte pr´etrait´e Vous avez du remarquer entre autres probl`emes, que certains mots que l’on voudrait

regrouper apparaissent sous des formes diﬀ´erentes (pluriel des noms, verbes conjugu´es), et que les mots

fonctionnels (d´eterminants, pr´epositions par exemple) sont courants sans ˆetre tr`es int´eressants.

Vous trouverez dans le ﬁchier http://www.irit.fr/˜Philippe.Muller/alice wonderland.utf8.conll une ver-

sion du texte d´ej`a pr´etrait´e, o`u chaque ligne correspond `a une analyse pr´elable d’un mot du texte, avec sa

forme telle qu’elle apparait dans le texte, son lemme (cad la forme normalis´ee correspondant `a son entr´ee

dans le dictionnaire), et une ´etiquette donnant sa cat´egorie: nom, verbe, d´eterminant, etc. Ecrivez de nou-

velles fonctions pour refaire les analyses pr´ec´edentes de fa¸con plus simple avec ce ﬁchier, en essayant de

param´etrer le plus possible (faire varier les cat´egories `a garder par exemple).

Analyse de s´equences Pour avoir des informations plus int´eressantes, on peut aussi regarder les s´equences

de 2 mots cons´ecutifs. Ecrivez des fonctions pour compter toutes les s´equences avec l’approche simple, et

garder les plus int´eressantes

G´en´eraliser pour compter des s´equences de longueur arbitraire (ﬁx´ee `a l’avance). On appelle ces s´equences

de n mots des n-grammes (bigrammes pour n=2, trigrammes pour n=3, etc).

Vous pouvez aller voir par curiosit´e l’inventaire historique fait par Google

https://books.google.com/ngrams.

Bonus: tout combiner G´en´eraliser la question pr´ec´edente aux ﬁchiers pr´etrait´es.

In [ ]:

1 / 2 100%

Documents connexes

Initiation `a l`informatique I. Initiation `a Python Université de

Mini projet 2

de M.-C. Hofner et N. Viens Python

Semaine 2

Télécharger la fiche action PRE

Initiation `a l`informatique III. Introduction `a Python : Codage

programme_formation_python

Semaine 1

Travaux dirigés – Ondes dans les fluides – Travail en autonomie

Semaine 1

Open Source >> Python

Imprimez la fiche

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

TP Python SRI 1

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

TP Python SRI 1

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib