Optimisation des réseaux de neurones par l`AIS pour le traitement

publicité
Université des sciences et de la technologie d'Oran Mohamed Boudiaf
Faculté de mathématique et informatique
Département d’informatique
Option : Télédétection, Analyse et
Traitement Informatique des
Données Spatiales
Spécialité: Informatique
Mémoire présenté par:
NOUICER Imene Eps. MADJOUB
Pour l'obtention du diplôme de MAGISTER
Thème:
Optimisation des réseaux de neurones par l’AIS
pour le traitement des données optiques
Soutenu publiquement le: 19 / 01 / 2014 (à 14h00 la salle des soutenances)
Devant le jury:
Président
Mr BENYETTOU Abdelkader
Professeur
USTO(MB)
Rapporteur
Mme FIZAZI Hadria
professeur
USTO(MB)
Examinateur
Mr BELKADI Khaled
Maitre de conférences
USTO(MB)
Examinatrice
Mme CHOURAQUI Samira
Maitre de conférences
USTO(MB)
Examinateur
Mr YOUCEFI Djaffar
Chargé de recherche
C.T.S (ARZEW)
Table des matières
Introduction générale
Chapitre I :Télédétection et classification
1.
2.
3.
Introduction .................................................................................................. 3
Définition de la télédétection ....................................................................... 3
Terme Essentielles En Télédétection ........................................................... 3
3.1.
3.2.
3.3.
3.4.
3.5.
3.6.
4.
Principe de la télédétection .......................................................................... 4
4.1.
4.2.
4.3.
5.
Emission d’un rayonnement .............................................................................. 5
Interaction avec l’atmosphère ........................................................................... 5
Interaction avec la cible ..................................................................................... 6
Enregistrement de l’énergie par le capteur ..................................................... 6
Transmission de l’énergie .................................................................................. 6
Interprétation et analyse .................................................................................... 6
Application .......................................................................................................... 6
Le rayonnement électromagnétique ............................................................ 7
6.1.
6.2.
6.3.
6.4.
6.5.
7.
8.
9.
La source d’énergie ............................................................................................ 5
La cible ................................................................................................................ 5
Le vecteur ............................................................................................................ 5
Le processus de la télédétection ................................................................... 5
5.1.
5.2.
5.3.
5.4.
5.5.
5.6.
5.7.
6.
Capteurs .............................................................................................................. 3
Image ................................................................................................................... 4
Image numérique................................................................................................ 4
Image multi spectrale ......................................................................................... 4
Pixel ..................................................................................................................... 4
Source .................................................................................................................. 4
Définition ............................................................................................................. 7
Le champ électrique (E) ..................................................................................... 7
Le champ magnétique (M) ................................................................................ 7
Les caractéristiques du REM ............................................................................ 7
Propriétés des rayonnements électromagnétique ............................................ 8
Le spectre électromagnétique..................................................................... 10
La signature spectrale ................................................................................ 12
Type des Systèmes d’acquisition ................................................................ 12
9.1.
9.2.
9.3.
Télédétection passive (visible, infrarouge) ..................................................... 12
Télédétection passive (infrarouge et micro-onde) ......................................... 12
Télédétection actif ............................................................................................ 13
10. Les satellites ................................................................................................ 13
10.1.
10.2.
Satellite géostationnaire ................................................................................... 13
Satellite héliosynchrone ................................................................................... 14
11. Données optiques........................................................................................ 16
12. Image satellitaire ........................................................................................ 17
12.1.
Caractéristique des images satellitaires ......................................................... 17
13. Prétraitement .............................................................................................. 19
13.1.
13.2.
13.3.
Réduction de bruit ............................................................................................ 19
Rehaussement ................................................................................................... 20
Transformation de l’image .............................................................................. 20
14. Traitement ................................................................................................... 20
14.1.
14.2.
Segmentation..................................................................................................... 20
Classification ..................................................................................................... 20
15. Conclusion .................................................................................................. 21
Chapitre II : Les réseaux de neurones
1.
2.
3.
4.
Introduction ................................................................................................ 22
Le modèle neurophysiologique .................................................................. 22
Le modèle mathématique ........................................................................... 23
Structures d'interconnexion ...................................................................... 25
4.1.
4.2.
4.3.
4.4.
5.
Apprentissage.............................................................................................. 27
5.1.
5.2.
5.3.
5.4.
6.
7.
Notion d’apprentissage .................................................................................... 27
Apprentissage supervisé .................................................................................. 27
Apprentissage non supervisée ......................................................................... 28
Les règles d’apprentissage ............................................................................... 28
Généralisation ............................................................................................ 29
Le modèle MLP .......................................................................................... 29
7.1.
7.2.
8.
Réseau multicouches ........................................................................................ 25
Réseau à connexions locales ............................................................................ 26
Réseau à connexions récurrentes .................................................................... 26
Réseau à connexion complète .......................................................................... 27
Algorithme du MLP ......................................................................................... 30
Domaine d’application ..................................................................................... 32
Conclusion .................................................................................................. 32
Chapitre III : Les systèmes immunitaires
1.
2.
Introduction ................................................................................................ 33
Système immunitaire naturel ..................................................................... 34
2.1.
2.2.
2.3.
2.4.
2.5.
Immunité naturelle ........................................................................................... 34
Définition d’antigène ........................................................................................ 34
Composant du système immunitaire naturel ................................................. 35
Fonctionnement ................................................................................................ 38
Les maladies du système immunitaire ............................................................ 39
3.
Le système immunitaire artificiel .............................................................. 40
3.1.
3.2.
4.
Les notions de bases du système immunitaire artificiel ................................ 40
Les algorithmes du système immunitaire artificiel ....................................... 42
Conclusion .................................................................................................. 51
Chapitre IV : Conception et Implémentations
1.
2.
3.
4.
Introduction ................................................................................................ 52
Ressource et matériels utilisées ................................................................. 52
Données expérimentale .............................................................................. 52
Approche hybride proposé ......................................................................... 53
4.1.
4.2.
4.3.
4.4.
4.5.
4.6.
4.7.
5.
6.
Déroulement de l’algorithme ..................................................................... 56
Schéma de l’application ............................................................................. 57
6.1.
6.2.
6.3.
6.4.
6.5.
6.6.
6.7.
7.
Chargement des images brutes ....................................................................... 58
Coloration de l’image ....................................................................................... 58
Amélioration de l’image................................................................................... 58
Échantillonnage ................................................................................................ 58
L’apprentissage par l’AIS ............................................................................... 58
L’apprentissage par MLP ............................................................................... 58
La classification ................................................................................................ 58
Application et Résultats .............................................................................. 58
7.1.
7.2.
7.2.
8.
Introduction ...................................................................................................... 53
Population ......................................................................................................... 53
Mesure d’affinité .............................................................................................. 53
Le clonage.......................................................................................................... 54
Mutation ............................................................................................................ 54
Evaluation de la nouvelle population ............................................................. 55
Les opérations du MLP : ................................................................................. 55
Influence des paramètres ................................................................................. 60
Hybridation MLP-AIS ………………………………….……………………63
Hybridation MLP-CLONCLASS ................................................................... 67
Conclusion .................................................................................................. 73
Conclusion générale
Bibliographie
Table des figures et tableaux
Chapitre I : Télédétection et classification
Figure I. 1: Le principe de la télédétection ............................................................................. 5
Figure I. 2: Les étapes du processus de la télédétection ......................................................... 6
Figure I. 3: Le rayonnement électromagnétique .................................................................... 8
Figure I. 4:Interactions du rayonnement électromagnétique avec la matière. (Absorption,
réflexion, transmission)............................................................................................................. 9
Figure I. 5 :Phénomène de réfraction ................................................................................... 10
Figure I. 6: Le spectre électromagnétique ............................................................................ 10
Figure I. 7: La signature spectrale des surfaces naturelles. ................................................ 12
Figure I. 8: Utilisation du rayonnement électromagnétique en télédétection ..................... 13
Figure I. 9: Satellite géostationnaire ..................................................................................... 14
Figure I. 10: Satellite héliosynchrone ................................................................................... 14
Figure I. 11: Résolution spatiale des images du Quickbird (Document Digital Globe 2008) ..... 18
Figure I. 12: Résolution radiométrique des images(Document CCRS/CCT) ...................... 19
Tableau I. 1: Caractéristiques et applications des bandes spectrales du capteur TM. ......... 16
Chapitre II : Les réseaux de neurones
Figure II. 1: Neurone biologique avec son arborisation dendritique [Net 3]....................... 23
Figure II. 2 : Neurone artificiel .............................................................................................. 24
Figure II. 3: Neurone formel .................................................................................................. 24
Figure II. 4: Différents types de fonctions de transfert pour le neurone artificiel. [1] ........ 25
Figure II. 5: Réseau multicouches ......................................................................................... 25
Figure II. 6: Réseau à connexions locales ............................................................................. 26
Figure II. 7: Réseau à connexions récurrentes ..................................................................... 26
Figure II. 8 : Réseau à connexion complète .......................................................................... 27
Figure II. 9: Apprentissage Supervisé .................................................................................... 28
Figure II. 10: Apprentissage non Supervisé .......................................................................... 28
Figure II. 11: Architecture D’un Perceptron Multicouches avec deux couches cachées. ... 30
Tableau II . 2 :La loi de Hebb................................................................................................. 29
Tableau II . 3 : La règle de delta ............................................................................................ 29
Chapitre III : Les systèmes immunitaires
Figure III.
Figure III.
Figure III.
Figure III.
Figure III.
Figure III.
Figure III.
1: Les cellules du système immunitaire naturel ................................................. 35
2: Cellule granulocytes ........................................................................................ 35
3: Cellule monocyte.……………………………………………………………36
4: Cellule macrophage ........................................................................................ 36
5: Cellule lymphocyte B ...................................................................................... 36
6: Cellule lymphocyte T ....................................................................................... 36
7 : Structure D’un Anticorps .............................................................................. 37
Figure III.
Figure III.
Figure III.
Figure III.
Figure III.
Figure III.
Figure III.
8: Représentation des données binaire ............................................................... 40
9: Représentation des données réelles ................................................................ 40
10: Représentation des données sous forme arborescence [Net 7] ................... 41
11: L’algorithme de la sélection négative ........................................................... 43
12: Pseudo-code de l’algorithme de la sélection négative. [22] ......................... 44
13: L’algorithme de la sélection clonale ............................................................ 47
14: Pseudo-code de l’algorithme de la sélection clonale. .................................. 48
Tableau III. 1 : Comparaison entre la réponse primaire et secondaire .............................. 39
Chapitre IV : Conception et Implémentations
Figure IV.
Figure IV.
Figure IV.
Figure IV.
Figure IV.
Figure IV.
Figure IV.
Figure IV.
Figure IV.
Figure IV.
Figure IV.
Figure IV.
Figure IV.
Figure IV.
Figure IV.
Figure IV.
Figure IV.
Figure IV.
Figure IV.
1: Image d’Oran ouest prise par LANDSAT5 .................................................... 53
2: Organigramme de l’application ...................................................................... 57
3 : Image d’Oran ouest échantillonné 1 ............................................................. 59
4 : Image classifié du cas (A) test 1 MLP-AISb , EQM = 0.21853..……..……63
5 : Image classifié du cas(A) test 1 MLP- AIS , EQM = 0.20726 ...................... 63
6: Image classifié du cas (B)test 1 MLP- AISb , EQM = 0,19408 ....................... 64
7 : Image classifié du cas (C)test 1 MLP- AIS, EQM= 0,21486 ........................ 65
8: Image classifié du cas (A)test 2 MLP- AIS, EQM= 0,23358.……………….66
9: Image classifié du cas (A) test 2 MLP- AISb , EQM = 0,27374 ..................... 66
10: Image classifié du cas (B)test 2 MLP- AIS, EQM = 0,29335 ...................... 66
11: Image classifiée(C)test 2 MLP- AIS, EQM =0.093 ...................................... 67
12: Image classifié du test 3MLP- AISB, EQM=0.15201 …………………….70
13: Image classifié du test 3MLP- AIS,EQM=0,14665 ...................................... 70
14: Image classifié du test 4MLP- AISB , EQM=0,15368………………..……71
15: Image classifié du test 4 MLP- AIS , EQM=0,14082 .................................. 71
16: Image classifié du test 5MLP- AISB ,EQM = 0.14604 ................................. 71
17: Image classifié du test 5MLP- AIS , EQM = 0,13450 .................................. 71
18: Image classifié du test 6MLP- AISB ,EQM = 0.10036 ................................. 72
19: Image classifié du test 6MLP- AIS , EQM =0.13420 ................................... 72
Tableau IV.
Tableau IV.
Tableau IV.
Tableau IV.
Tableau IV.
Tableau IV.
Tableau IV.
Tableau IV.
Tableau IV.
Tableau IV.
Tableau IV.
Tableau IV.
1: Tableau Des Echantillons N°1 ..................................................................... 60
2: Les paramètres fixés pour le premier essai .................................................. 61
3: Les résultats obtenus pour le premier essai.................................................. 61
4: Les paramètres fixés pour le deuxième essai ............................................... 62
5: Les résultats obtenus par le deuxième essai ................................................. 62
6: Les résultats obtenus par le troisième essai.................................................. 62
7: Les paramètres fixés pour le test 1................................................................ 63
8: Les paramètres fixés pour le deuxième test .................................................. 65
9: Influence du nombre de population ............................................................. 68
10: Influence du nombre du coefficient β ........................................................ 69
11:Influence du nombre d’itération AIS .......................................................... 69
12: Influence du nombre d’itération MLP ....................................................... 70
Remerciements
Ce travail a été effectué au laboratoire SIMPA de l’Université des Sciences et de la
Technologie d’Oran (U.S.T.O.M.B).
Nous exprimons notre profonde reconnaissance au professeur FIZAZI.H qui nous a suivi
durant toutes notre formation, nous tenons à lui exprimer toute notre estime pour son soutien aussi
bien sur le plan scientifique que humain.
Nous remercions le Professeur BENYETTOU .A de l’université des Sciences et de la
Technologie d’Oran MB, qui nous a bien fait l’honneur d’être président de notre jury, nous lui
exprimons nos sincères remerciements.
Nous remercions personnellement madame CHOURAQUI .S et Messieurs BELKADI .K ,
De l’université des Sciences et de la Technologie d’Oran MB , ainsi que monsieur YOUCEFI.D du
centre de recherche CNTS d’ARZEW pour avoir accepté d’examiner ce travail, et de faire partie de
ce jury.
En fin, que l’ensemble des personnes que nous avons eu le plaisir de côtoyer, trouvent en ces
quelques mots le témoignage de notre reconnaissance pour leur sympathie et leur accueil chaleureux.
Dédicaces
Je dédie ce modeste travail ;
A mon cher et tendre époux pour toute sa compréhension, son aide et son amour qui ont
illuminé mon chemin à chaque fois que je perdais l’espoir. Je lui exprime ma gratitude et mon amour
pour son encouragement durant tout ce temps.
A ma très chère poupée IBTIHALE.
A mes très chers parents qui ont tant prié pour moi, qui voient aujourd’hui l’un de leurs
rêves se réalisé. Je les remercie pour leur affection, encouragement.
A mes beaux parents pour toute la compréhension et l’aide qui m’ont procuré.
A mon frère, mes sœurs, mon beau frère et ma belle sœur d’avoir toujours été là quand j’en
avais besoin, ainsi que de leur appuis et leur affection.
A sou sou, ma meilleur amie et ma source d’énergie, qui me bouscule a chaque fois.
A Ishak
A Nourhanne, Marwa, Abderrahmane, Aminou , Chaymoua et Youcef
A toute ma famille, ma grand mère mes tantes et leur enfants.
A tous mes amis(es), avec qui je partage ou bien j’ai partagé des instants gravé à toujours
dans mon cœur.
Imene
Introduction générale
Afin de faciliter son mode de vie, l’être humain créa plusieurs sciences et développa
divers outils. L’informatique est considérée comme l’une des récentes sciences servant à
régler les différents problèmes de la vie quotidienne.
La nouveauté et l’efficacité de cette science lui a permis de s’intégré dans tous les
domaines, mathématique, biologie, médecine, géographie …etc. Ces outils lui ont permis de
surmonter tous types de difficultés, tels la gestion des bases de données médicale, les réseaux
commandant la signalisation routière, et le traitement des images, de son et de paroles utilisé
dans la conception des systèmes de sécurités ….etc.
L’objectif de notre étude est le traitement des données optiques obtenues par la
télédétection.
Plusieurs recherches ont été orienté vers la classification des images satellitaires, vue
l’intérêt de leurs utilisation dans les différents domaines, comme l’agriculture, la foresterie, la
géologie et la cartographie ….etc. L’objectif de ces recherches est de trouver la méthode la
plus rapide avec un taux d’erreur minime.
De nos jours, la majorité des méthodes implémentées sont inspirées du corps humain,
spécifiquement de son mode de fonctionnement, appelés méthodes bio-inspirées.
L’une des premières modélisations de la biologie en informatique est les réseaux de
neurone artificiels, qui a suscité l’intérêt de plusieurs recherches et découvertes. Divers autres
méthodes son inspirèrent tels les algorithmes génétiques, les systèmes immunitaires artificiels,
l’essaim particulier et les colonies de fourmis.
Les recherches développées dans la classification des images satellitaires ont incité
les chercheurs à optimiser les résultats des algorithmes développés anciennement. Dans Notre
étude, on opta pour l’optimisation des réseaux de neurones artificiels par une autre méthode
bio-inspirée « les systèmes immunitaires artificiels ».
1
Ce mémoire est constitué des quatre chapitres suivants :
Le premier chapitre introduit les notions de base des images, les techniques
d’acquisition ainsi que le processus de télédétection permettant l’obtention des données
optiques.
Le second chapitre est consacré à la définition du neurone formel, ensuite à éclaircir
le mode de fonctionnement des réseaux de neurones naturelle et artificiels, alors nous
aborderons les différents types de réseaux de neurones artificiels, plus spécifiquement le
perceptron multi couche avec l’algorithme de la rétro-propagation.
La troisième partie de ce mémoire développe les systèmes immunitaires biologiques,
ces différentes maladies auto-immunes, les Systèmes Immunitaires Artificielles (AIS), en
détaillant les différents algorithmes apparus, comme la sélection négative et la sélection
clonale.
Le dernier chapitre explique le concept des méthodes proposées de l’approche
hybride entre les réseaux de neurone MLP et les systèmes immunitaires artificiels ainsi que la
discussion des différents résultats obtenus de chaque implémentation.
2
Chapitre 1
Télédétection et
classification
Télédétection et classification
Télédétection et classification
1. Introduction
La technique de télédétection a vu le jour au début des années 60 aux États-Unis pour
désigner la détection à distance avec les premières photographies aériennes prisent depuis
un ballon.
Depuis, elle inspire les chercheurs des différents domaines. Après le lancement du
premier satellite LANDSAT1 en 1972, plusieurs d’autres lui ont succédé. De nos jours
presque tous les pays possèdent leur propre satellite. Cette évolution conduisit à imager de
plus en plus de région, jusqu'à la couverture intégrale de la terre entière.[1][2]
2. Définition de la télédétection
Le terme télédétection est composé de deux mots :
Télé signifiant « à distance » et détection veut dire « découvrir » ou « déceler ».
Elle est définie comme la technique permettant l’acquisition des différentes
caractéristiques physiques et biologiques d’un objet à partir d’un ensemble de
connaissance scientifique et d’opérations sans entrer en contact direct (matériel) avec
lui.[1][2]
La Commission interministérielle de terminologie de la télédétection aérospatiale, l’a
défini comme suit en 1988 : « Ensemble des connaissances et techniques utilisées pour
déterminer des caractéristiques physiques et biologiques d’objets par des mesures
effectuées à distance, sans contact matériel avec ceux-ci. »
3. Terme Essentielles En Télédétection
3.1. Capteurs
Ils sont les appareillages responsable du recueille et de la mesure du rayonnement
incident des différents objets observés pour le transformer en un signal enregistré sous
forme numérique. Le type et les caractéristiques du capteur (résolution spectrale,
radiométrique..) dépendent de l’application.[Net1]
3
Télédétection et classification
3.2. Image
Est un tableau rectangulaire d’éléments (pixels) de même dimension possédant un ou
plusieurs attributs codés numériquement, chaque image est caractérisé par sa structure et
son format.
Le capteur et son mode de fonctionnement définissent la structure de l’image et le mode
d’enregistrement indique le format de l’image.
3.3. Image numérique
Est la représentation de l’image par un nombre fini de points discrets. Chaque cellule de
la matrice spatiale reçoit une valeur numérique (par exemple entre 0 et 255) qui représente
les niveaux de brillance de l’image.[Net 1]
3.4. Image multi spectrale
Est un ensemble de données obtenus simultanément, à condition que chaque ensemble
se trouvant dans une région différentes du spectre électromagnétique.
3.5. Pixel
Le pixel est le plus petit élément constituant l’image, la valeur du pixel résulte d’une
intégration à la fois spatiale et spectrale.[Net 1]
3.6. Source
C’est l’objet ou le système qui produit le rayonnement interagissant avec la cible
observée mesuré par le capteur.
4. Principe de la télédétection
La télédétection est le résultat d’interaction de trois éléments fondamentaux : une source
d’énergie, une cible et un vecteur (un satellite ou un avion).[1][2]
4
Télédétection et classification
Figure I. 1: Le principe de la télédétection
4.1. La source d’énergie
Est l’élément qui éclaire la cible en émettant des ondes électromagnétiques,
généralement le soleil. Cependant le radar n’as pas besoin d’une source d’énergie.
4.2. La cible
Est la partie visée par l’observation de la terre.
4.3. Les vecteurs
Sont les capteurs qui mesurent l’énergie (le rayonnement électromagnétique) réfléchit
par la cible. Ils existent plusieurs types de capteurs tel que : Les avions, les satellites...
5. Le processus de la télédétection
Comprend sept étapes :
5.1. Emission d’un rayonnement
A la provenance de tout processus de télédétection se trouve nécessairement une source
d’énergie pour illuminer la cible en émettant une onde électromagnétique.
5.2. Interaction avec l’atmosphère
Le rayonnement interagit avec l’atmosphère, durant son parcours entre la source
d’énergie et la cible et entre la cible et le capteur.
5
Télédétection et classification
5.3. Interaction avec la cible
Une fois parvenue à la cible, l’énergie interagit avec la surface de celle-ci, cette
interaction dépend des caractéristiques du rayonnement et des propriétés de la surface.
5.4. Enregistrement de l’énergie par le capteur
Le vecteur ou plate-forme de télédétection capte l’énergie réfléchie par la cible, pour
être enfin enregistrée.
5.5. Transmission de l’énergie
L’énergie enregistrée par le capteur est transmise souvent par des moyens électroniques
à une station de réception ou l’information est transformée en images numériques, ou
photographiques.
5.6. Interprétation et analyse
Pour mieux interpréter la cible et pour découvrir ces aspects, une interprétation visuelle
et/ou numérique de l’image traitée est nécessaire, pour extraire l’information que l’on
désire obtenir sur la cible.
5.7. Application
La dernière étape du processus consiste à utiliser l’information extraite de l’image pour
mieux comprendre la cible.
4
2
1
1
2
2
5
3
7
6
Figure I. 2: Les étapes du processus de la télédétection
6
Télédétection et classification
6. Le rayonnement électromagnétique
6.1. Définition
Le rayonnement électromagnétique (REM) est le moyen porteur de l’information sur les
objets détectés, il est défini comme l’énergie qui se propage dans l’espace ou dans la
matière sous forme de champs électriques et magnétiques perpendiculaires entre eux.
6.2. Le champ électrique (E)
Varie en grandeur et est orienté de façon perpendiculaire à la direction de propagation
du rayonnement.
6.3. Le champ magnétique (M)
Orienté de façon perpendiculaire au champ électrique.
Les deux champs se déplacent à la vitesse de la lumière (C).
6.4. Les caractéristiques du REM
Le rayonnement électromagnétique a les caractéristiques suivantes
6.4.1. La longueur d’onde λ
Équivalant à la longueur d’un cycle d’une onde, c’est-à-dire la distance entre deux
crêtes successives d’une onde. Mesurée en mètre
6.4.2. La fréquence f
Représente le nombre d’oscillation par unité de temps. Elle est mesurée en hertz.
La période t où
La célérité de la lumière C où C = λ.f
7
Télédétection et classification
Figure I. 3: Le rayonnement électromagnétique
6.5. Propriétés des rayonnements électromagnétique
6.5.1. Emission
Tout corps dont la température est supérieure au zéro absolu (0° Kelvin équivaut à 273°C) émet un rayonnement électromagnétique issu de l’agitation thermique des
molécules, dont la longueur d’onde est fonction de la température.
Emission et absorption étant liées (loi du rayonnement de Kirchhoff). Le physicien Max
Planck en 1900 imagina ce qui se produirait dans le cas idéal du corps noir.[5]
6.5.2. Réflexion
La réflexion se définit comme un changement de direction du rayonnement
électromagnétique quand celui-ci atteint une surface. En télédétection, le phénomène de
réflexion est primordial, car l’identification de la nature des objets par les capteurs
satellitaires repose en grande partie sur la manière dont ils renvoient le rayonnement. La
direction du rayonnement réfléchi peut varier, elle dépend de la rugosité des surfaces
naturelles. On distingue ainsi trois types de réflexion : réflexion spéculaire, réflexion
diffuse et réflexion de volume.
6.5.3. Absorption
Tous les corps naturels absorbent une partie du rayonnement qui leur parvient. La partie
du rayonnement absorbé modifie l'énergie interne du corps. Il y a production de chaleur et
réémission de l'énergie à une plus grande longueur d'onde.
8
Télédétection et classification
En télédétection spatiale, la notion d'absorption est fondamentale car le signal parvenant
au capteur satellitaire est modifié au cours de la traversée atmosphérique où le
rayonnement est fortement absorbé par les constituants gazeux et les particules en
suspension.
Il est intéressant de noter que contrairement à ce qui se passe dans l'atmosphère,
transparente aux rayonnements visible et proche infrarouge, les surfaces naturelles elles,
absorbent une partie de ces rayonnements.
6.5.4. Transmission
Lorsqu’une partie du rayonnement incident passe à travers un milieu, on dit que le
rayonnement est transmis. Le phénomène de transmission concerne les milieux plus ou
moins transparents comme l'eau, les nuages ou l'atmosphère, mais pas uniquement. Le
feuillage des arbres par exemple se comporte comme un milieu transparent vis-à-vis du
rayonnement proche infrarouge.
Cette notion de transmission est très importante en télédétection, puisque les capteurs
dédiés à l’observation des surfaces terrestres et océaniques utilisent les bandes spectrales
pour lesquelles l’absorption du rayonnement solaire par l’atmosphère est négligeable. Ces
bandes spectrales correspondent aux fenêtres atmosphériques discutées dans le chapitre
précédent.
Figure I. 4: Interactions du rayonnement électromagnétique avec la matière. (Absorption,
réflexion, transmission)
9
Télédétection et classification
6.5.5. Réfraction
Le phénomène de réfraction correspond à une déviation de la trajectoire du
rayonnement lorsqu’il passe d’un milieu à un autre n’ayant pas le même indice de
réfraction (rapport entre vitesse de la lumière dans le vide et vitesse de la lumière dans le
milieu considéré). La réfraction se produit à l’interface entre les deux milieux.
Figure I. 5 : Phénomène de réfraction
Selon les lois de Descartes, le rayon réfracté est dans le plan d'incidence et la relation
liant les indices de réfraction n 1 et n 2 de chacun des milieux et les angles incident θ1 et
réfracté θ2 est la suivante : n1 sin θ1 = n2 sin θ2 .
7. Le spectre électromagnétique
Le spectre électromagnétique représente la répartition des ondes électromagnétiques en
fonction de leur longueur d'onde, de leur fréquence ou bien encore de leur énergie (figure
ci-dessous).
Figure I. 6: Le spectre électromagnétique
10
Télédétection et classification
 Les rayons gamma ( γ ) : Leurs longueurs d’onde s'étendent d’un centième de
milliardième (10-14 m) à un milliardième (10-12 m) de millimètre.
 Les rayons X : Les rayons X ont des longueurs d’onde comprises entre un
milliardième (10-12 m) et un cent millième (10-8 m) de millimètre.
 Les ultraviolets : Leurs longueurs d’onde s’échelonnent d’un cent millième (108
m) à quatre dixièmes de millième (4.10-7 m) de millimètre.
 Le domaine visible : Il s’étend de quatre dixièmes de millième (4.10-7 m)
« lumière bleue » à huit dixièmes de millième (8.10-7 m) de millimètre « lumière
rouge ».
 L’infrarouge : La gamme des infrarouges couvre les longueurs d’onde allant de
huit dixièmes de millième de millimètre (8.10-7 m) à un millimètre (10-3 m). En
télédétection, on utilise certaines bandes spectrales de l'infrarouge pour mesurer
la température des surfaces terrestres et océaniques, ainsi que celle des nuages.
 Les ondes radar ou hyperfréquences : Le domaine des hyperfréquences
s’étend des longueurs d’onde de l’ordre du centimètre jusqu’au mètre.
 Les ondes radio : Il s'étend des longueurs d'onde de quelques cm à plusieurs
km.
Contrairement à l'œil humain qui n’est capable de capter le rayonnement que dans une
fenêtre très étroite du spectre électromagnétique, celle correspondant au domaine du visible
(longueurs d'onde comprises entre 0,4μm et 0,7μm), les capteurs satellitaires utilisent une
fraction beaucoup plus étendue du spectre.
Domaines spectrales utilisés en télédétection spatiale sont :

Le domaine de l’ultraviolet

Le domaine du visible

Le domaine des infrarouges (proche IR, IR moyen et IR thermique)

Le domaine des micros ondes ou hyperfréquences (pas abordé ici, même si elles
ont une importance considérable en télédétection RADAR notamment).[7]
11
Télédétection et classification
8.
La signature spectrale
Le signal capté, réfléchis ou émis par la surface terrestre, les océans ou l'atmosphère, est
appelé la signature spectrale.
La signature spectrale est considérée comme la carte d’identité radiométrique de l’objet
à étudier, chaque objet possède sa propre carte. Traduite dans une image par une position
en coordonnées dans un repère de type RGB (Red, Green, Bleu).
Figure I. 7: La signature spectrale des surfaces naturelles.
9. Type des Systèmes d’acquisition
L’´émergence de nouveaux capteurs d’imagerie satellitaire à haute résolution, dans le
cadre du programme d’observation de la Terre requiert plusieurs systèmes d’acquisition
partagés en trois groupes selon leurs sources de rayonnement.[4]
9.1. Télédétection passive (visible, infrarouge)
On peut l’appeler aussi optique. Le domaine du spectre solaire est le visible et le proche
infrarouge, de 0,3 à 4 µm Dans ce type Le soleil est la source, le capteur mesure le
rayonnement visible et/ou infrarouge réfléchi par la cible observée. Ce domaine est par
excellence celui de la télédétection des espaces terrestres.
9.2. Télédétection passive (infrarouge et micro-onde)
Le domaine de L’infrarouge thermique : Au-delà de 3 µm. La cible observée est la
source du rayonnement donc le capteur mesure l’’émission thermique de cibles et marine
12
Télédétection et classification
et de l’atmosphère. La télédétection infrarouge est surtout destinée à mesurer la
température du sol, de l’océan, ou des nuages
9.3. Télédétection actif
On peut l’appeler aussi radar. Un capteur radar émet son propre rayonnement
électromagnétique et en analysant le signal rétrodiffusé, il permet de localiser et
d’identifier les objets, et de calculer leur vitesse de déplacement s’ils sont en mouvement.
Et ceci, quel que soit la couverture nuageuse, de jour comme de nuit.
Figure I. 8: Utilisation du rayonnement électromagnétique en télédétection
10. Les satellites
Le satellite est la plate-forme qui effectue des observations à distance par réception
d'ondes électromagnétiques à l'aide des capteurs. C’est un objet qui gravite autour de la
terre grâce à la force de la gravité terrien.
On peut partager les satellites on plusieurs types selon leurs orbite :
10.1. Satellite géostationnaire
Ils sont situés à environ 36000 Km de la terre, ils assurent une observation continue de
la même partie de la terre car ils ont une position fixe et ils se déplacent à la même vitesse
et dans le même sens que la terre.
Leurs domaines d’utilisations sont la météorologie et la climatologie.
13
Télédétection et classification
Exemple : METEOSAT, NOAA
Figure I. 9: Satellite géostationnaire
10.2. Satellite héliosynchrone
Situés approximativement entre 600 et 1000 Km de la terre, ils sont fixe et ne suivent
pas le déplacement de la terre, donc ils peuvent observer régulièrement un point particulier
à la même heure solaire.
Leurs domaines d’application sont la cartographie et la géologie.
Exemple : SPOT, LANDSAT.
Figure I. 10: Satellite héliosynchrone
14
Télédétection et classification
10.2.1.
Caractéristiques du LANDSAT :
Notre étude est basée sur une image en provenance du satellite LANDSAT car toutes
les images extraites des LANDSAT sont riches en informations géologiques.
Le LANDSAT1 (Land Satellite) a été Nommé en premier lieu Earth Ressources
Technological Satellite (ERTS) lancé par la NASA en 1972, dans le but de réaliser des
prises de vue multicanales de la surfaces terrestre. La série LANDSAT fut divisée en trois
générations la première du LANDSAT 1 au 3 dont l’altitude est de 917 Km et un système
d’acquisition de 4 canaux et une résolution de 80 m et la deuxième génération de
LANDSAT 4 et LANDSAT 5 dont l’altitude est de 705 Km un système d’acquisition de
7 canaux et une résolution de 30 m.
La dernière génération avec LANDSAT 6, lancé le 5 Octobre 1993 et écrasé en mer lors
du lancement, et LANDSAT 7 lancé avec succès le 15 Avril 1999. Tous deux équipés de
nouveaux capteurs : le Thematic Mapper (TM) et l’Enhanced Thematic Mapper Plus
(ETM+), il contient 7 canaux :
15
Télédétection et classification
Tableau I. 1: Caractéristiques et applications des bandes spectrales du capteur TM.
11. Données optiques
Il existe plusieurs techniques et appareils d’acquisition des données optiques tels que les
loupes, les microscopes et les satellites.
Le satellite produit des images optiques grâce à les instruments (capteurs) optiques
HRVIR (Haute Résolution Visible et InfraRouge) qui le compose.
Les images optiques allient la haute résolution et le champ large. Ces images satellites
optiques ouvrent de nouvelles perspectives pour le développement de services et
16
Télédétection et classification
d’applications sur des thématiques aussi variées que la surveillance maritime, l’agriculture,
l’environnement et la surveillance des forêts.[4]
12. Image satellitaire
Les images satellitaires sont conçues à partir d’informations relevées par des satellites.
Le satellite balaye point par point la surface terrestre et attribue une valeur entre 0 et 255 à
chaque point de surface en fonction de la quantité d’énergie renvoyée. Ces données
chiffrées sont transmise à une station au sol qui compose l’image de la région survolé point
par point. Chaque valeur reçue attribue une nuance de gris au pixel dessiné.
L’image est défini comme une fonction f (x, y) a deux variables x et y ou x est la ligne
et y est la colonne fournissant une ou plusieurs valeurs entières représentant les niveaux de
gris du pixel.
12.1. Caractéristique des images satellitaires
Les images satellitaires sont caractérisées comme les images simples par plusieurs
critères tels que la taille la résolution …
12.1.1.
La taille
La taille d’une image correspond au nombre de pixels qui compose l’image en hauteur
et en largeur.
12.1.2.
La résolution
Les images se composent de pixels, la taille du pixel détermine la résolution de l’image,
et cette taille dépend elle-même de la résolution des capteurs embarqués sur le satellite.
Les images de télédétection sont caractérisées par deux types de résolution :
12.1.2.1.
La résolution spectrale
Est le nombre de pixel par unité de longueur de la structure à numériser. Cette
caractéristique est définie lors de la numérisation et dépend du matériel utilisé.
Généralement La résolution spectrale est déterminée par la largeur des bandes spectrales
utilisées par le capteur ainsi que par le nombre de bandes. Il est évident, qu'un grand
17
Télédétection et classification
nombre de bandes spectrales étroites peut nous aider à mieux évaluer la signature spectrale
de différents objets.
12.1.2.2.
La résolution spatiale
Est la plus petite distance entre deux objets adjacents que le capteur peut identifier.
Cette distance minimale Entre ces deux objets sera donc fonction du type de capteur utilisé
ainsi que de la distance qui le sépare des objets.
Figure I. 11: Résolution spatiale des images du Quickbird (Document Digital Globe 2008)
12.1.2.3.
La résolution radiométrique
La résolution radiométrique exprime la capacité d'un détecteur de mesurer des faibles
variations de la quantité du REM. Elle est fonction du système de détection mais aussi du
nombre de niveaux de gris utilisés pour créer l'image finale. Ainsi, le même territoire
observé sur une image créée avec une échelle de 4 niveaux de gris montre beaucoup moins
de nuances qu'une image à 256 niveaux de gris. La plupart des capteurs actuels utilisent
des échelles de gris en 8 bits (28= 256). Des capteurs avec un enregistrement de 12 ou 16
bits existent également.
18
Télédétection et classification
4 niveaux de gris
255 niveaux de gris
(2 bits)
(8 bits)
Figure I. 12: Résolution radiométrique des images (Document CCRS/CCT)
12.1.2.4.
La résolution temporelle
La résolution temporelle exprime le nombre de jours nécessaires pour qu'un satellite
puisse observer de nouveau la même région. Par exemple, un système satellitaire avec une
résolution temporelle de 18 jours ne peut être utilisé à l'étude d'un phénomène dynamique
nécessitant des observations tous les 3 jours, même si les autres caractéristiques de
l'imagerie sont adéquates.
Notons que le satellite SPOT offre la possibilité de viser un site sur commande
permettant ainsi d’assurer une excellente résolution temporelle. Sans manœuvre, la
résolution temporelle de SPOT est de 26 jours, 16 jours pour LANDSAT TM et 14.5 jours
pour NOAAAVHRR.[3]
13. Prétraitement
Ensemble des opérations effectuées sur l’image brut afin d’améliorer son état et faciliter
le traitement en renforçant la ressemblance ou accentuant la dissemblance entre les
différents pixels de cette image.
13.1. Réduction de bruit
Cette opération permet de réduire les perturbations qui affectant la qualité du traitement
en réduisant l’amplitude des variations d’intensité dans chaque région.
19
Télédétection et classification
13.2. Rehaussement
Consiste à étirer les contraste afin d’augmenter la distinction des tons entre les
différents éléments d’une scène.
13.3. Transformation de l’image
Sont des opérations similaires à ceux de rehaussement de l’image et combine le
traitement des données de plusieurs bandes spectrales.
14. Traitement
Les opérations du traitement consistent dans l’extraction des informations et on peut
distinguer plusieurs méthodes tel que :
14.1. Segmentation
Est l’étiquetage des différents pixels de l’image afin de décomposer cette dernière en
plusieurs régions qui ont les mêmes caractéristiques. On peut distinguer trois méthodes de
segmentation :

Approche région : Consiste à grouper les pixels semblables pour obtenir des régions
homogènes

Approche frontière : Consiste à rechercher les pixels dissemblables afin de trouver
les contours entre les zones hétérogènes.

Approche hybride : Cette méthode consiste à mélanger les deux approches
précédentes.[6]
14.2. Classification
La classification occupe une place importante dans le monde de l’imagerie : il s'agit en
effet de parvenir à découper puis à regrouper des informations appartenant a la même
classe pour aboutir enfin à réaliser le découpage optimale.
On peut distinguer deux grandes méthodes de classification :
14.2.1.
Classification supervisée
Dans cette méthode de classification l’analyste identifie au début un ensemble
homogène de données qui compose les données-test. La sélection de ces données est basée
20
Télédétection et classification
sur sa connaissance, Cet échantillon est ensuite utilisé pour l'apprentissage des règles de
classement donc la classification est supervisé par l’expert analyste. [8][Net 2 ]
Les méthodes les plus utilisées pour ce type de classification sont les SVM et les
méthodes bios inspirées tel que les algorithmes génétiques les réseaux de neurones comme
le perceptron multicouche utilisé dans notre étude.
14.2.2.
Classification non supervisée
Cette méthode vise à regrouper un ensemble de données en segment, partition ou bien
des répartitions des individus en classes, en optimisant une règle qui vise l’homogénéité et
la distinction de ces individus pour les quelle une classe est apriori connue au moins pour
un échantillons d’apprentissage. [6]
Il existe plusieurs méthodes de classification non supervisé tels que méthode des nuées
dynamiques, Le regroupement hiérarchique et L'analyse en composantes principales
15. Conclusion
Dans cette première partie nous avons abordé les différentes étapes d’acquisition des
images optiques exploitées dans notre étude, les divers définitions des termes scientifique
utilisés par la suite et les méthodes de prétraitement et traitement appliqué sur ces image
afin
de
mieux
comprendre
21
les
chapitres
suivants
Les réseaux de neurones
.
Chapitre 2
Les Réseaux de neurones
Les réseaux de neurones
Les réseaux de neurones
1. Introduction
Le cerveau est un système complexe qui effectue un travail énorme au niveau du
corps humain, il est responsable de toutes les activités biologiques grâce à de nombreuse
cellules appelées neurones. Leur traitement parallèle de l’information a incité les chercheures
scientifiques à modéliser un système mathématique neuronal qui permet l’utilisation des
mécanismes de ces neurones dans divers domaines, ce système est nommé le réseau de
neurone.
Un réseau neuronal est un ensemble de neurones artificiels interconnectés par des
liens qui simulent les dendrites (à l'entrée d'un neurone) ou l'axone (à la sortie du neurone).
Lorsque les entrées d'un neurone satisfont certaines conditions d'activation, le neurone émet
une valeur de sortie qui à son tour influencera d'autres neurones, ce système de
fonctionnement permet à l'ensemble d'accomplir des actes intelligents. Un réseau se distingue
en général par le type de neurone formel utilisé, la règle d’apprentissage qui le décrit et
l’architecture définissant les interconnections entre neurones. [9]
Les réseaux de neurones ont fait l’objet d’un intérêt en progression continuelle
depuis une vingtaine d’années à cause de leur capacité, flexibilité et parcimonie. Ils sont
fabriqués de structures cellulaires artificielles pour construire une approche qui permet la
résolution des problèmes de perception, de mémoire, d’apprentissage et de raisonnement.
2. Le modèle neurophysiologique
L’élément de base du système nerveux central est le neurone. Le cerveau se compose
d'environ mille milliards de neurones, avec 1000 à 10000 synapses (connexions) par neurone.
Le neurone est une cellule composée d’un corps cellulaire et d’un noyau. [10]
Le corps cellulaire se ramifie pour former ce que l’on nomme les dendrites. Celles-ci
sont parfois si nombreuses que l’on parle alors de chevelure dendritique ou d’arborisation
dendritique. C’est par les dendrites que l’information est acheminée de l’extérieur vers le
soma (corps du neurone). L’information est traitée alors par le corps cellulaire. Si le potentiel
d’action dépasse un certain seuil, le corps cellulaire répond par un stimulus.
Le signal transmis par le neurone chemine ensuite le long de l’axone (unique) pour
être transmis aux autres neurones. La transmission entre deux neurones n’est pas directe.
22
Les réseaux de neurones
En fait, il existe un espace intercellulaire de quelques dizaines d’Angströms entre
l’axone du neurone afférent et les dendrites du neurone efférent. La jonction entre deux
neurones est appelée synapse. [2]
La figure suivante décrit un neurone avec son arborisation dendritique.
Figure II. 1: Neurone biologique avec son arborisation dendritique.[Net 3]
3. Le modèle mathématique
Les réseaux de neurones biologiques réalisent facilement un certain nombre
d'applications telles que la reconnaissance des formes, le traitement du signal, l'apprentissage
par l'exemple, la mémorisation et la généralisation. C'est à partir de l'hypothèse que le
comportement intelligent émerge de la structure et du comportement des éléments de base du
cerveau, que les réseaux de neurones artificiels se sont développés.
La Figure 2 montre la structure d'un neurone artificiel.
Chaque neurone artificiel est un processeur élémentaire. Il reçoit un nombre variable
d'entrées en provenance de neurones amont. A chacune de ces entrées est associé un poids w,
abréviation de weight (poids en anglais), représentatif de la force de la connexion. [10]
Chaque processeur élémentaire est doté d'une sortie unique, qui se ramifie ensuite
pour alimenter un nombre variable de neurones aval.
23
Les réseaux de neurones
Figure II. 2 : Neurone artificiel
Il existe un grand nombre de modèles de neurones. Les plus utilisés sont basés sur le
modèle développé par McCULLOCH & PITTS. Le neurone peut être représenté par une
cellule possédant plusieurs entrées et une sortie, et peut être modélisé par deux phases.
(Figure 2.3).[1]
x
1
y  f a 
w
11
a
x
i
i
i
w
j
ij
Figure II. 3: Neurone formel
La première phase, appelée activation, représente le calcul de la somme pondérée des
entrées selon l'expression suivante :
a w x
i
i
ij
j
[1]
Où :Xj représente les valeurs d'entrées
Wij représente les poids synaptiques entre le neurone d'entrée Xj et le neurone Xi
24
Les réseaux de neurones
A partir de cette valeur, une fonction de transfert calcule la valeur de l'état du
neurone. C'est cette valeur qui sera transmise aux neurones aval.
Il existe de nombreuses formes possibles pour la fonction de transfert. Les plus
courantes sont présentées dans la Figure 2.4. On remarquera qu'à la différence des neurones
biologiques dont l'état est binaire, la plupart des fonctions de transfert sont continues, offrant
une infinité de valeurs possibles comprises dans l'intervalle [0,+1] ou [-1, +1].
a. fonction à
b. fonction linéaire
seuil
par morceaux
c. fonction
sigmoïde
d. fonction
gaussienne
tangentielle
Figure II. 4: Différents types de fonctions de transfert pour le neurone artificiel. [1]
4. Structures d'interconnexion
Les connexions entre les neurones qui composent le réseau décrivent la topologie du
modèle. Elle peut être quelconque, mais le plus souvent il est possible de distinguer une
certaine régularité. Ils existent plusieurs types de topologie
4.1. Réseau multicouches
Les neurones sont arrangés par couche. Il n'y a pas de connexion entre les neurones
d'une même couche et les connexions ne se font qu'avec les neurones des couches suivantes.
Figure II. 5: Réseau multicouches
25
Les réseaux de neurones
Habituellement, chaque neurone d'une couche est connecté à tous les neurones de la
couche suivante et celle-ci seulement. Ceci nous permet d'introduire la notion de sens de
parcours de l'information au sein d'un réseau et donc définir les concepts de neurone d'entrée,
neurone de sortie. Par extension, on appelle couche d'entrée l'ensemble des neurones d'entrée
et couche de sortie l'ensemble des neurones de sortie. Les couches intermédiaires n'ayant
aucun contact avec l'extérieur sont appelées couches cachées.
4.2. Réseau à connexions locales
Il s'agit d'une structure multicouche mais qui conserve une certaine topologie.
Chaque neurone entretient des relations avec un nombre réduit et localisé de neurones de la
couche suivante (Figure 2.6). Les connexions sont donc moins nombreuses que dans le cas
d'un réseau multicouche classique.
Figure II. 6: Réseau à connexions locales
4.3. Réseau à connexions récurrentes
Les connexions récurrentes ramènent l'information en arrière par rapport au sens de
propagation défini dans un réseau multicouche. Ces connexions sont le plus souvent locales
(figure 2.7).
Figure II. 7: Réseau à connexions récurrentes
26
Les réseaux de neurones
4.4. Réseau à connexion complète
C’est la structure d'interconnexion la plus générale (Figure 2.8). Chaque neurone est
connecté à tous les neurones du réseau (et à lui-même). [11]
Figure II. 8 : Réseau à connexion complète
5. Apprentissage
5.1. Notion d’apprentissage
La composition complexe du système neuronal lui permet d’effectuer de nombreuses
opérations telle que l’apprentissage grâce à lequel la personne peut
reconnaitre son
environnement, distinguer entre les langues et les différentes expériences passées à travers les
modifications qui s’opèrent entre les connexions des neurones, certaines de ces connexions
seront renforcées d’autres seront affaiblies ou bien complètement effacées c’est sur ce
principe qui se base l’algorithme d’apprentissage des réseaux de neurones.
L’apprentissage dans les réseaux de neurones est défini comme étant un processus
dynamique et itératif durant lequel les poids du réseau seront modifiés selon la fonction
d’activation et les données entrées afin d’obtenir le comportement désiré. Dans ce cadre, on
peut distinguer plusieurs types d’apprentissage les plus connus sont l’apprentissage supervisé
et le non supervisé.
5.2. Apprentissage supervisé
L’apprentissage supervisé est renforcé par un ensemble de données dites sorties
désirées Dn, c’est en fonction de ces données que le réseau doit produire ces propres sorties
en calculant à chaque fois l’écart entre les deux sorties dans le but de le minimiser.
27
Les réseaux de neurones
W
D(n)
Réseau de
neurone
X(n)
Y(n)
E(n)
<
Algorithme
d’adaptation
Figure II. 9: Apprentissage Supervisé
5.3. Apprentissage non supervisée
Dans ce type d’apprentissage le réseau n’a aucune connaissance sur les sorties donc il doit
s’auto-Organisé afin d’optimiser la fonction définie. [13][1]
W
Réseau de
neurone
X(n)
Y(n)
Algorithme
d’adaptation
Figure II. 10: Apprentissage non Supervisé
5.4. Les règles d’apprentissage
5.4.1. Loi de Hebb
En 1949, Le physiologiste américaine Donald HEBB a présenté une règle qui porte
son nom et qui est présente presque dans tous les modèles actuels. Son principe est que Si
deux unités connectées sont actives simultanément, le poids de leur connexion est augmenté
ou diminué. [12]
j
wij
i
ΔWij = R AiAj
« R » est une constante positive qui représente la force d'apprentissage (learning
rate).
28
Les réseaux de neurones
Ai = -1
Ai = 1
Aj = -1
ΔWij = R
ΔWij = -R
Aj = 1
ΔWij = -R
ΔWij = R
Tableau II . 1 : La loi de Hebb
5.4.2. La règle de delta :
En 1957 l’automaticien américaine Bernard WINDROW et HOFF ont mis en place
la règle de delta, qui est définie par une sortie désirée fixé par l’expert humain et une
activation produite par le réseau, si la sortie est inférieure à la réponse désirée, il va falloir
augmenter le poids de la connexion à condition bien sûr que l'unité `j` soit excitatrice (égale à
1).
J
wij
i
ΔWij = R(Di-Ai)Aj
Ai = 0
Ai = 1
Di = 0
ΔWij = 0
ΔWij = -R
Di = 1
ΔWij = R
ΔWij = 0
Tableau II . 2 : la règle de delta
6.
Généralisation
La généralisation peut être décrite comme la capacité de reconnaitre un nouvel
ensemble de données qui n’appartient pas à l’ensemble d’apprentissage, donc le réseau est
capable d’approximer une fonction à partir d’une partie des données. Ceci peut être lié à la
notion de sur-apprentissage, ces deux caractéristiques sont antagonistes car si le réseau
apprend parfaitement les exemples proposés, il sera incapable de généraliser. [9]
7. Le modèle MLP
Le perceptron multicouche est le réseau le plus utilisé grâce à la simplicité et la
rapidité de son apprentissage. Le principe de son architecture est de regrouper plusieurs
neurones dans une même couches et les connectés aux neurones de la couche suivante jusqu'à
la dernière couche qui produit les résultats. Les neurones de la première couche reçoivent les
29
Les réseaux de neurones
entrées du réseau et chaque couche intermédiaire reçoit les sorties de la couche précédente.
Ces couches n’ont aucun contact avec l’extérieur, elles sont dites couches cachées à la fin de
cette chaine on trouve la couche de sortie qui reçoit les sorties de la dernière couche caché.
La figure suivante représente l’architecture d’un perceptron multicouche avec deux
couches cachée.
Couche d’entrée
Première
Deuxième
Couche cachée
Couche cachée
Couche de sortie
Couches cachées
Figure II. 11: Architecture D’un Perceptron Multicouches avec deux couches cachées.
7.1. Algorithme du MLP
7.1.1. Types d’entrées
Les entrées du MLP prennent plusieurs formes elles peuvent être binaires, entières ou
réelles.
7.1.2. Fonction d’activation
Les fonctions les plus utilisées dans ce type sont les fonctions sigmoïdes et les
fonctions à seuils
30
Les réseaux de neurones
7.1.3. Apprentissage
Le type d’apprentissage le plus utilisé est l’apprentissage supervisé.
7.1.4. Algorithme d’apprentissage
Le MLP utilise pour son apprentissage un algorithme de rétro-propagation du
gradient (back-propagation) qui est une généralisation de la règle de WINDROW-HOFF
(règle de delta).
On peut partager l’algorithme en deux étapes essentielles :
7.1.4.1. Propagation avant
Le but principal de cette étape est le calcul de l’erreur global du réseau.
Pour chaque neurone de la couche caché calculer la somme pondérée des valeurs de
sortie des neurones de la couche d’entrée :Pour i =1….n
aj
Calculer la valeur de sortie de chaque neurone de la couche cachée en appliquant sa
fonction de sortie :
Xj=F (aj )
Pour chaque neurone de la couche sortie calculer la somme pondérée des valeurs de
sortie des neurones de la couche cachée :Pour j=1....m
Calculer la valeur de sortie de chaque neurone de la couche sortie en appliquant sa
fonction :
Yk=F (ak )
Calculer l’erreur de chaque sortie par : EL= Ydes-Ykou Ydes :la sortie désirée.
Calculer la fonction de l’erreur quadratique :
Pour tout l’ensemble d’apprentissage N, la fonction d’erreur quadratique
moyenne(EQM) :E(n)=
7.1.4.2. Rétro-propagation
Son but est de modifier les poids de chaque couche
Calculer le signal d’erreur de la couche de sortie :δl=(ydes-yk)F` (ak)
31
Les réseaux de neurones
Calculer la modification du poids de la couche sortie : Δwjk= η δlxj
Avec η une constante définie par l’expert généralement fixé à 1.
Rétro pager les erreurs δl vers la couche cachée précédente.
Calculer la contribution de Chaque neurone de la couche cachée dans l’erreur
global :δinl=
Calculer le signal d’erreur de chaque neurone cachée : δj = δinlF` (aj ).
Calculer la modification du poids de la couche cachée : Δwij= η δjx
i
Modification des poids
(Nouveau) wij = Δ wij+ wij(ancien)
(Nouveau) wjk = Δwjk+ wjk(ancien)
Les deux étapes de l’algorithme serons répétées jusqu’as ce que le critère d’arrêt soit
satisfait.
Le critère d’arrêt est sois le nombre maximale d’itérations est atteint sois l’erreur est
considéré comme négligeable (atteindre le seuil fixé).[14]
7.2. Domaine d’application
Le réseau MLP est considéré comme un séparateur non linéaire et peut être utilisé
dans divers domaines tel que la reconnaissance des formes (images..), le traitement de signal
et de la parole, la classification, le domaine bancaire ou à l’aide a la décision. [Net 4]
8. Conclusion
Le point fort du MLP est sa capacité de généralisation, notamment sur les données
bruitées mais il y a un risque de convergence vers un optimum local.
Les performances du réseau de neurones sont très souvent liées à son architecture. Le
nombre des unités cachés dans un MLP ont un impact sur ses performances. On peut trouver
des
difficultés
dans
le
réglage
32
des
paramètres.
Chapitre 3
Les systèmes immunitaires
Les systèmes immunitaires
Les systèmes immunitaires
1. Introduction
Chaque organisme possède un système d’auto défense qui lui permet de se protéger
des différents pathogènes attaquant ses cellules, ce système est appelé le système immunitaire
naturel et a été découvert en 1984 par le docteur Niel JERNE.
Il est constitué d’un ensemble d’organes, tissus, cellules et molécules permettant de
répondre contre les invasions des organismes étrangères tel que les bactéries et les virus.
Les cellules responsable dans le système immunitaire biologique sont les globules
blancs formés en moelle osseuse, on distingue différentes classes de ces globules tel que les
polynucléaires, les macrophages et les lymphocytes T et B et les cellules NK. Elles se
caractérisent par un ensemble de mécanismes qui lui permet de reconnaitre le soi du non soi et
de rejeter ce qui lui est étranger.[15]
Le système immunitaire artificiel (SIA) ou artificiel immune système (AIS) est classé
dans la catégorie des algorithmes inspirée bio. Le principe de fonctionnement de cette
méthode est inspiré du système immunitaire naturel des vertèbres afin d’exploiter leurs
caractéristiques de mémorisation et d’apprentissage dans le monde de l’intelligence artificiel.
Les premiers travaux sur ce système ont commencé dans le milieu des années 80 par
FARMER, PACKARD et PERELSON sur les réseaux immunitaires en 1986 et se lance dans
les années 90 par FORREST et AL sur la sélection négative en 1994 en même temps que
HUNT et COOKE sur des modèles de réseaux immunitaire.
Le premier livre sur les systèmes immunitaires artificiels a été publié en 1999 par
DASGUSTA.
En 2002 les travaux de DE CASTRO &VON ZUBEN et NICOSIA &CUTELLO
sur l’algorithme de la sélection clonale « CLONALG » furent remarqués.
Plusieurs algorithmes inspirés du système immunitaire ont été explorés même ce de
la réponse immunitaire innée et le fait que ces algorithmes apportent de nouvelles succès est
le sujet de débats qui animent le développement des systèmes immunitaires artificiels.[16]
33
Les systèmes immunitaires
2. Système immunitaire naturel
2.1.
Immunité naturelle
L’immunité est la capacité de l’organisme à résister à des attaques étrangères
menaçantes pour son bon fonctionnement ou sa survie. On peut citer deux types d’immunité
naturelle :
2.1.1. L’immunité innée
Est la première ligne de défense présente dès la naissance et évolue par interaction de
l’individu avec l’environnement. Appelé aussi immunité non spécifique adapté à un nombre
réduit d’antigène, ce type d’immunité est non adaptative mais a un rôle fondamental dans
l’initiation des réponses adaptatives. Elle fait l’objet de quatre barrières :
1)
anatomique : peau, muqueuse, sécrétions glandulaires….
2)
physiologique : température, PH, sueur, larme…
3)
Phagocytaire : macrophages et polynucléaires
4)
réaction inflammatoire locale : rougeurs, douleurs, œdème… [17]
2.1.2. L’immunité acquise
Appelé aussi immunité spécifique adapté a un nombre infini d’antigènes, elle se
développe lorsqu’un antigène apparaisse une deuxième fois ou plus dans le même corps
activant ainsi les cellules B mémoire développées pour ce type d’antigène. La réponse dans ce
type d’immunité est plus rapide que dans l’immunité innée cela revient à sa capacité de
mémorisation, sa spécificité, sa diversité et sa reconnaissance du soi et non soi. Ces
caractérisations ont incité les chercheurs à développer un système immunitaire artificiel.
2.2. Définition d’antigène
L’antigène est l’entité étrangère et dangereuse qui stimule les cellules à produire un
acide spécifique engendrant la réponse immunitaire. Cette entité peut être un virus ou une
bactérie.
Chaque antigène possède une partie spécifique appelé épitope.[18]
34
Les systèmes immunitaires
2.3.
Composant du système immunitaire naturel
Le système immunitaire est constitué des trois composantes suivantes : les cellules,
les substances peptidiques libres et les organes.
2.3.1. Les cellules
Les cellules du système immunitaire sont toutes des leucocytes et sont répartie en
trois catégories montrées dans la figure suivantes :
Leucocytes
Immunité innée
Granulocy
tes
Immunité acquise
Lymphocyt
es
Monocytes/macrophage
s
Cellules T
Cellules B
Plasma
Cellules mémoires
Figure III. 1: Les cellules du système immunitaire naturel
Les granulocytes : Ce sont les cellules les plus nombreuses dans le sang ils détruisent toutes
les cellules porteuses d’antigènes.
Figure III. 2: Cellule granulocyte
Les monocytes et les macrophages : Les monocytes se trouvent dans le sang avec un
faible pourcentage et subissent différentes modifications pour devenir des macrophages qui
détruisent les bactéries se trouvant dans les lieux des infections et les globules rouges en fin
de vie.
35
Les systèmes immunitaires
Figure III. 3: Cellule monocyte
Figure III. 4: Cellule macrophage
Les lymphocytes : Représentent 20 à 40 % des leucocytes, ces cellules sont spécifiques ils ne
peuvent reconnaître qu’un seul antigène. On distingue deux types de lymphocytes T et B.
Lymphocytes B : Ces cellules produisent les récepteurs d’antigène appelé anticorps ces
derniers se terminent dans les deux extrémités par un paratope qui permet de se lié à l’épitoge
de l’antigène.
Figure III. 5: Cellule lymphocyte B
Lymphocytes T : Représentent environ 70% de tous les lymphocytes. Il existe deux types :
Figure III. 6: Cellule lymphocyte T
36
Les systèmes immunitaires
- Les lymphocytes T cytotoxiques attaquent et détruisent les cellules étrangères
directement sans la production d’anticorps.
- Les lymphocytes T auxiliaire régularisent l’activité des autres cellules du système
immunitaire naturel.[Net 5]
Anticorps : C’est des protéines complexes formés de 4 chaînes polypeptidiques deux chaînes
lourdes (H pour heavy) et deux chaînes légères (L pour light) reliées entre elles par des ponts
assurant une flexibilité de la molécule. Ces chaînes forment une structure en Y. Chaque
chaîne légère est constituée d’une partie constante et d’une partie variante et chaque chaîne
lourde d’une partie variante et de 3 ou 4 fragments constants.
Les anticorps ont trois fonctions principales : se lier à l’antigène, activer le système
du complément et recruter des cellules immunocompétentes.[19]
Figure III. 7 : Structure D’un Anticorps
37
Les systèmes immunitaires
2.3.2. Substances solubles
Les trois types de protéines qui composent le système immunitaire sont :
L’immune globine :Il existe un nombre infini d’immunes globines exerçant des fonctions
d’anticorps. Cette diversité est une caractéristique du système immunitaire naturel.
Les cytokines : Leurs rôle est de régularisé la réponse immunitaire par l’amplification, par le
croissement ou par la suppression.
Le système du complément : Qui contient environ vingt protéines qui agissent d’une
manière non spécifique. Ils se lient au complexe antigène-anticorps pour faciliter l’ingestion
de particules par certains types de leucocytes appelés phagocytes(monocytes, macrophages,
polynucléaires..).
2.3.3. Les organes
Sont les organes qui forme et hébergent les lymphocytes tel que la moelle osseuse et
le thymus, la rate, les ganglions lymphatiques et différentes structures annexées aux
muqueuses.[Net 6]
2.4. Fonctionnement
La réponse immunitaire est déclenchée au sein d’un organisme vital après la
détection d’un antigène. Elle est composée des étapes qui suivent :
2.4.1. Réaction inflammatoire
La première barrière de défense contre les intrus, son but est de désactiver les
agresseurs sans connaitre leur nature cette réponse est donc non spécifique.[20]
2.4.2. Réponse immunitaire
On peut distinguer deux types de réponse immunitaire qui se différent dans les cinq
points suivants :[15]
38
Les systèmes immunitaires
La cause
Réponse primaire
Réponse secondaire
Introduction de l’antigène pour la
Introduction du même antigène
première fois dans l’organisme.
dans l’organisme une nouvelle fois.
Long (quelque jour) interaction Court car les cellules mémoires
Temps de latence
cellulaire entre les lymphocytes et spécifiques se transforment en
les macrophages (leur surface).
plasmocytes
et
génèrent
les
anticorps.
La production des anticorps en Plus long à cause de la production
fonction des divisions et les en double des anticorps à partir des
Phase de synthèse
différentiations des lymphocytes cellules mémoires et les nouveaux
lymphocytes
activés.
d’une
réponse
primaire.
Phase de déclin
La
phase
d’épuisement
longue
car
le
nombre
d’anticorps est plus important.
stimulus antigénique.
Phase de repos
du Plus
L’antigène n’est plus détecté.
Prend plus de temps.
Tableau III. 1 : Comparaison entre la réponse primaire et secondaire
2.5. Les maladies du système immunitaire
Les maladies du système immunitaire résultent d’un dysfonctionnement du système
immunitaire qui s’attaque aux constituants normaux de l’organisme. C’est le cas
par exemple de la sclérose en plaques, du diabète de type 1.
Normalement, le système immunitaire défend l’organisme vis-à-vis d’agressions
extérieures et tolère ses propres constituants. Les maladies auto-immunes surviennent quand
cette tolérance se rompt. Le système immunitaire devient alors pathogène et induit des lésions
tissulaires ou cellulaires. Ces maladies évoluent de façon chronique tout au long de la vie,
avec des phases de poussées et de rémissions.
39
Les systèmes immunitaires
3. Le système immunitaire artificiel
3.1. Les notions de bases du système immunitaire artificiel
3.1.1. La représentation des données
La représentation des données joue un rôle majeur dans le déroulement de
l’algorithme et influe directement sur les résultats obtenus. On peut distinguer plusieurs types
de codages des individus mais les plus utilisées sont :
Le codage binaire : Ce type de codage est le plus utilisée en intelligence artificielle, il
consiste à créer une chaine de bits binaires de taille fixe de longueur n.
1 0 0 0 1 1 1 1 0
1 0 1 0 0 0 1 1 0
n bits
Figure III. 8: Représentation des données binaire
Le codage réel (à caractère multiples) : Ce type de codage est le plus utilisé dans les
systèmes immunitaires artificiels, il consiste à représenter chaque individu dans un espace de
dimension n (Rn).
1
2
X
X
3
4
X
X
… … X
n-2
n-1
X
X
n
Figure III. 9: Représentation des données réelles
Le codage par structure arborescente (fonctionnelle) : Ce type de codage est rarement
utilisé dans le domaine d’intelligence artificielle, il consiste à créer un arbre qui doit être
parcouru de gauche à droite en commençant par la première feuille de gauche jusqu'à la
dernière feuille de droite en passant par tous les nœuds et les feuilles de l’arbre. [Net 7]
40
Les systèmes immunitaires
+
*
a
b
c
d
Figure III. 10: Représentation des données sous forme arborescence [Net 7]
3.1.2. L’affinité
L’affinité est le degré de ressemblance entre un antigène et un anticorps elle se
mesure par la distance (euclidienne, hamming…..), deux individus ont une affinité élevée si la
distance entre eux est la plus petite par rapport aux autres.
3.1.3. Le clonage
Le clonage est la duplication des organes pour avoir des êtres génétiquement
identique. Le but de cette opération est de garder les informations plus longtemps dans
l’espace de travail.
3.1.4. La Mutation
La mutation est définie comme une modification irréversible de l’information
génétique.
La mutation est une opération de Ω vers Ω qui produit un nouvel individu x’ proche
de x.
Mutation : Ω
Ω
X
X’
Cette opération permet une recherche aléatoire dans l’espace afin de pouvoir détecter
des optima qui ne sont pas encore visités.
41
Les systèmes immunitaires
La mutation varie selon la représentation des données, dans ce sens, on trouve
différents types de mutation dans le cas de présentation binaire, de même pour la mutation
gaussienne dans le cas des représentations réelles. [15][18]
3.2. Les algorithmes du système immunitaire artificiel
3.2.1. La sélection négative
La sélection négative est utilisée pour la détection du soi et le non-soi, elle a été
proposée pour des problèmes de détection d’anomalies et d’intrusion, son principe est de
partir d’un ensemble de détecteurs et de détecter des changements dans cet ensemble de soi
s’ils existent.
3.2.1.1.
L’algorithme de la sélection négative :
L’algorithme de sélection négative est basé sur la génération d’un ensemble de
détecteurs qui sera chargé de détecter les éléments du non-soi.
L'algorithme de sélection négative fonctionne comme suit:
1- Nous avons un ensemble de données S représentant le soi.
2- un ensemble de détecteurs RD est généré aléatoirement dans l’espace de travail.
3- L’affinité de tous Les éléments de l’ensemble RD avec les éléments de
l’ensemble S sera déterminé, si un élément de S est reconnu par un élément de
RD c'est-à-dire le plus proche alors l’élément de RD sera rejeté, sinon il sera
ajouté à l’ensemble RD.
4- Si une chaîne de S change de forme (mutation), elle à de grandes chances qu’elle
soit reconnue par un des détecteurs de RD.[21]
5- Pour certains ensembles de chaines, des trous peuvent apparaitre qui ne peuvent
être couverts par n’importe laquelle des configurations possibles de détecteurs,
sans que cela conduise à recouvrir des chaines du soi
42
Les systèmes immunitaires
1. Chaines du soi S
2. Chaines S et des détecteurs RD
5. Trou dans les chaines du soi
3. Tolérisation
4. Détection de changement
Figure III. 11: L’algorithme de la sélection négative
43
Les systèmes immunitaires
La figure montre les démarches générales de la fonction d’une sélection négative
Function Negative Selection (S, r, n)
Entrées : S ensemble de valeur qui définissent le soi
R le seuil d’activation
N ensemble de détecteur requis
Begin
j←0
While j<= n do
M←rand (1, L)
// Initialisation
For every s of S do
// Affinity evaluation
Aff ← affinity (m, s, r)
If aff <= r then // Generation of the available répertoire
A← insert (A, m)
End If
end for
j←j+1
End While
Return A
End
Figure III. 12: Pseudo-code de l’algorithme de la sélection négative. [22]
44
Les systèmes immunitaires
Domaines d’utilisations de la sélection négative
3.2.1.2.
La sélection négative a été appliquée par ESPONDA et FORREST aux problèmes de
détection d’intrusions dans un réseau informatique. Le système LISYS, génère un ensemble
de détecteurs qui ne doivent détecter aucun paquet transmis sur un réseau sain mais qui
s’activent dès qu’ils rencontrent un suspect dans le réseau.
En 2003 ESPONDA et AL ont appliqué la sélection négative aux bases de données
négatives qui stockent des données dans leur forme négative de façon à ce que la récupération
des données sous leur forme d’origine est un problème difficile. Ces bases étant très utiles
dans la sécurité informatique pour leur rôle de stockage des mots de passes.
3.2.2. La sélection clonale
La sélection clonale est complémentaire à la sélection négative, elle est utilisée après
la reconnaissance du non soi (antigène) dans une chaine s par une cellule B.
L’algorithme proposé par certaines auteurs « CLONALG » a été inspiré des
principes biologique de la sélection clonale, il a été utilisé initialement pour la reconnaissance
des formes puis pour l’optimisation.
L’algorithme de CLONCLASS
3.2.2.1.
Les étapes fondamentales de CLONALG sont les suivantes :

Initialisation
Générer aléatoirement un ensemble S de solution « anticorps ». La population S
est divisée en 2 composants, des anticorps à "mémoire" m qui représentent la solution et un
ensemble r utilisé pour introduire de la diversité.

Répéter tant qu’une condition prédéfinie n’est pas vérifiée

Evaluation et sélection 1
Calculer l’affinité entre tous les éléments de S avec l’ensemble des antigènes et
sélectionner les anticorps qui ont la plus grande affinité.
45
Les systèmes immunitaires

Clonage
Cloner chaque anticorps sélectionné proportionnellement à son affinité, mettre les
clones dans un ensemble C.

Mutation
Chaque clone de C subisse une mutation avec un degré inversement proportionnel à
son affinité, Plus l’affinité est grande plus le taux de mutation est faible. Pour obtenir une
population mature C* qui répond mieux aux antigènes.

Evaluation et sélection 2
Sélectionner S2 anticorps de C* qui ont les plus grandes affinités pour obtenir un
nouveau ensemble d’anticorps mémoire.

Diversité
Combiner S2 avec l’ensemble m, les anticorps générés aléatoirement et remplacer
ceux qui ont la plus faible affinité pour obtenir l’ensemble des anticorps mémoire m .

Mort
Les anticorps non retenus dans m seront éliminés.
46
Les systèmes immunitaires
Une fonction générale de la sélection clonale est comme suit:
Figure 3.13. : L’algorithme de la sélection clonale[21]
1. Initialisation de la
population d’anticorps
2. Cellules B activées
3. Cellules B clonées
4. Maturation des cellules B
5. Nouvelle population
d’anticorps
6. Diversification de la
population d’anticorps
Figure III. 13: L’algorithme de la sélection clonale
47
Les systèmes immunitaires
Figure III. 14: Pseudo-code de l’algorithme de la sélection clonale.
48
Les systèmes immunitaires
Notez que cet algorithme permet au système immunitaire artificiel de devenir
plus performent à sa tâche de reconnaissance des schémas (antigènes). Ainsi, en fonction d'un
comportement évolutionnaire, CLONALG apprend à reconnaître les modes. [22]
Domaines d’applications de la sélection clonale
3.2.2.2.
Cet algorithme a été utilisé par plusieurs auteurs tels que De Castro et Von Zuben qui
l’ont appliqué à l’optimisation ensuite il a été appliqué à la détection d’intrusions puis
l’algorithme DynamiCS, qui est traite une classification binaire avec deux classes le soi et le
non-soi et utilise la sélection clonale afin de généré les cellules mémoires qui reconnaissent le
non –soi sans reconnaitre le soi.
L’algorithme ClonAlg a été proposé pour la reconnaissance des formes mais sans
aboutir à un bon résultat. Donc White et Garrett l’ont amélioré en implémentant l’algorithme
de ClonClas.
3.2.3. Les réseaux immunitaires
Le principe de fonctionnement du réseau immunitaire est inspiré de la manière dont
les cellules du système immunitaire interagissent entre elles, cette théorie est l’objet d’un
nombre considérable de simulations dus aux réfutations de quelque immunologiste et elle fut
la base de plusieurs algorithmes tel que le réseau AINET qui est défini comme étant une
combinaison entre la sélection clonale et cette théorie.
3.2.3.1.
Algorithme AINET
Les différentes étapes de l’algorithme AINET sont :

Initialisation :

Un ensemble d’anticorps N générée aléatoirement ;

La population M de cellules mémoire est initialement vide ;

Un ensemble d’antigènes G qui présente les données d’apprentissage.
49
Les systèmes immunitaires
Pour chaque antigène, faire :
Répéter pour un certain nombre d’itérations :

Evaluation et sélection 1
Calculer l’affinité de chaque antigène avec tous les anticorps
Sélectionner un ensemble n d’anticorps qui ont les plus grandes affinités.
À partir de l’ensemble N.

Clonage

Cloner les anticorps proportionnellement à leurs affinités.

Mutation

Muter les anticorps clonés selon leur degré d’affinité, plus le taux d’affinités
est grand plus le taux de mutation est petit afin de créer un ensemble C* de population
mature.
Evaluation et sélection 2

Evaluer l’affinité de chaque antigène avec tous les anticorps de l’ensemble C*
Sélectionner les anticorps qui ont les meilleures affinités pour obtenir l’ensemble M des
cellules mémoire.

Suppression clonale 1

Eliminer les cellules mémoire qui sont très similaires les unes aux autres.

Mémorisation

Ajouter les cellules mémoire qui ont une affinité qui dépasse un certain seuil à
la population de cellules mémoire.

Mort

Eliminer Les anticorps et les cellules mémoire non mémorisés sélectionné.

Suppression clonale 2

Eliminer les cellules mémoire (de la population de cellules mémoire) très
similaires les unes aux autres.
50
Les systèmes immunitaires
En comparant les deux algorithmes la sélection clonale et le réseau immunitaire nous
remarquant trop de similarité on peut dire même que la sélection clonale immunitaire est un
cas particulier des réseaux immunitaires.
Seule l’étape de la suppression clonale qui permet l’interaction entre les anticorps
(les cellules mémoire) dans le réseau différencie les deux algorithmes. [23]
Domaines d’application
3.2.3.2.
Le domaine d’application des algorithmes de l’AIS est trop large en partant de
l’apprentissage jusqu’à la robotique en passant par une variété de domaine tel que la sécurité
informatique et la détection d’anomalies.
Chaque algorithme de l’AIS joue un rôle spécifique c’est la raison pour la quel on
trouve La sélection négative dans les bases de données« négative » qui permettent un mode de
stockage spécial qui facilite la récupération des données. En plus on la trouve dans le domaine
de la détection d’intrusions avec la sélection clonale qui améliore la reconnaissance du non
soi (intrusion, virus…) par l’apprentissage. [18][23]
La sélection clonale est utilisée aussi pour régler les problèmes d’optimisation,
d’apprentissage et de classification. [18]
Par ailleurs, les réseaux immunitaires ont été appliqués à l’analyse des activités d’un
serveur web et pour produire un système de reconnaissance et de classification de formes.
[16] [18]
4. Conclusion
Les systèmes immunitaires artificiels ont fait l’objet de plusieurs recherches, grâce
aux multiples caractéristiques ils ont été utilisés dans divers domaine. Ils se divisent en trois
familles, la premier famille de la sélection négative traite la détection de changement et les
problèmes de surveillance grâce à la technique de la reconnaissance du soi et le non soi, la
deuxième famille est la sélection négative qui résous les problèmes d’optimisation et détecte
les nouveautés dans des données de série chronologique grâce à la mémorisation et enfin la
famille des réseaux immunitaires ayant pour but de regrouper des données et de filtrer les
données
redondantes.
51
Chapitre 4
Conception et
Implémentations
Conception et implémentations
Conception et Implémentations
1. Introduction
Dans ce chapitre, on aborde le module expérimentations et résultats, après avoir
détailler le coté théorique des méthodologies utilisées dans les chapitres précédents. Notre
travail consiste à classer les différents pixels d’une image satellitaire en utilisant un réseau de
neurone (perceptron multi couche) optimisé par un système immunitaire artificiel.
La première étape consiste à choisir les poids optimaux pour le réseau, par
l’algorithme de la sélection clonale du système immunitaire artificiel qui seront ensuite
utilisées comme poids initiaux pour le réseau MLP.
La deuxième étape est la classification des différents pixels de l’image dans leurs
classes appropriées.
2. Ressource et matériels utilisées
Pour la mise en œuvre de notre application, on a utilisé un micro-ordinateur ayant les
caractéristiques suivantes :

Un processeur Intel Core 2 duo 2.10 GHz (T 6570).

Une mémoire vive de 2 GO.

Un disque dur de 140 GO.
Notre application a été développée sous un système d’exploitation Windows Vista 32
bits, ainsi qu’un langage de programmation « C++ BUILDER 6 » connu par les
informaticiens par sa flexibilité et sa souplesse.
3. Données expérimentale
La donnée optique utilisée dans notre application est l’image satellitaire prise par le
satellite LANDSAT5 en 1993, de la région ouest d’Oran, par le centre nationale des
techniques spatiales d’Arzew (CNTS).
Elle a été choisie pour sa diversité, car on peut distinguer plusieurs classes tel que :
mer, sable, ressac……
52
Conception et implémentations
Figure IV. 1: Image d’Oran ouest prise par LANDSAT5
4. Approche hybride proposé
4.1. Introduction
Plusieurs travaux de recherche ont été réalisés dans le but d’améliorer les
algorithmes des réseaux de neurones, par les algorithmes d’optimisation, telles que les
algorithmes génétiques et les systèmes immunitaires artificiels.
Le principe de l’approche proposée est de garder l’architecture du réseau MLP, ces
fonctions de calcule d’erreur, puis introduire les algorithmes de l’AIS dans l’apprentissage.
Dans ce cadre, on a utilisé en premier lieu l’algorithme de CLONALG, puis
l’algorithme de CLONCLASS dans l’apprentissage du réseau. En clair notre travail consiste
à remplacer la rétro-propagation par l’un des algorithmes cités ci-dessus.
4.2. Population
Les populations initiales de notre algorithme sont constituées d’un nombre
d’individus, ou chaque individu représente un poids du réseau, et chaque population
représente une configuration complète du réseau.
Les populations sont stockées sous forme de matrice, chaque ligne détermine
l’ensemble des poids de notre réseau, alors que chaque colonne est le numéro de l’individu de
cette population.
Au début de l’algorithme les populations sont définies aléatoirement, par la suite
elles seront modifiées par les opérations de clonage et de mutation.
4.3. Mesure d’affinité
La formule qui permet d’obtenir l’affinité est la suivante :
53
Conception et implémentations
Affinité = 1-D
(1)
Où D: représente la distance
La distance utilisée dans notre application est définie par l’erreur quadratique moyenne du
réseau (EQM) :
(2)
E(n) =
4.4. Le clonage
Selon leur affinité, un nombre de clones seront créés à partir de la population initiale.
La formule qui permet de générer le nombre de clones est :
C = Round [(N-1)*m]
(3)
Round ( ) : arrondi la valeur reçue à un entier.
Où N est donné par la formule : N =
(4)
affinité : est l’affinité entre l’anticorps et l’antigène en cours.
M : est la longueur du vecteur caractéristique de l’anticorps ou l’antigène.
Cette formule de CLONALG a été améliorée dans l’algorithme dans CLONCLASS comme
suit :
]
(5)
Où β : représente un coefficient définie par l’utilisateur (indique le nombre de clones
souhaités).
Et aff i : est l’affinité entre l’anticorps et l’antigène en cours.
4.5. Mutation
La population générée par le clonage subira la mutation. Le nombre de valeur à
muter pour chaque anticorps est donné par la formule suivante :
T = round [ (1-n)*L]
54
(6)
Conception et implémentations
Où L : représente la longueur d’un anticorps
4.5.1. Mutation binaire
Pour ce type de mutation tous les individus seront converti en binaire, ensuite les
différents bits des individus seront permuté avec d’autres bits à condition que le bit concerné
par la mutation actuelle n’a pas déjà subi de mutation dans cette itération.
4.5.2. Mutation Réelle
Pour ce type, la mutation se fait entre individus de la même population, à condition
que les individus concerné par la mutation n’ont pas déjà subit cette opération au cours de
cette itération.
La mutation est une opération très importante dans notre approche, c’est la raison pour
laquelle on a changé sa formule plusieurs fois, pour aboutir à la meilleure formule qui donne
le meilleur résultat.
4.6. Evaluation de la nouvelle population
Cette évaluation nous permet de reconstitués les populations initiales pour l’itération
suivante. Pour cela, On évalue la nouvelle population générée du clonage et la mutation afin
de sélectionner les nouveaux éléments.
4.7. Les opérations du MLP :
Dans l’approche proposée, nous aurons besoins des opérations MLP deux fois, la
première avant le calcul de l’affinité, car on doit calculer l’erreur quadratique moyenne du
réseau, afin d’obtenir ensuite l’affinité par la formule (1). La seconde, dans l’opération
d’évaluation de la nouvelle population générée par le clonage et la mutation.
55
Conception et implémentations
Les opérations de l’algorithme MLP utilisés sont les suivantes :
1- Pour chaque neurone de la couche cachée calculer:
Pour j= 1….n
aj
2- Calculer la valeur de sortie de chaque neurone de la couche cachée :
Xj = F (aj )
Où f est la fonction sigmoïde
3- Pour chaque neurone de la couche sortie calculer:
Pour k = 1....m
4- Calculer la valeur de sortie de chaque neurone de la couche sortie:
Yk = F (ak )
5- Calculer l’erreur de chaque sortie par :
EL= Ydes-Yk
Où Ydes : la sortie désirée.
6- Calculer la fonction de l’erreur quadratique :
7- Pour
tout l’ensemble d’apprentissage N, la fonction d’erreur quadratique
moyenne (EQM) :
E(n) =
5. Déroulement de l’algorithme
En premier lieu on utilise l’approche hybride MLP-AIS afin d’obtenir les meilleurs
poids pour le réseau, ensuite on utilise ses poids comme poids initiaux pour l’algorithme de
rétro-propagation du gradient MLP.
56
Conception et implémentations
6. Schéma de l’application
Image multi canal
Coloration de l’image
Amélioration de l’image
Echantillonnage
Apprentissage par l’AIS
Non
Critère d’arrêt
atteint
Oui
Apprentissage par MLP
Non
Critère d’arrêt
atteint
Oui
Erreur d’apprentissage
Classification
Image classifiée
Figure IV. 2: Organigramme de l’application
57
Conception et implémentations
6.1. Chargement des images brutes
La première étape consiste à charger les trois images brutes d’extensions IMG des
canaux TM1, TM3 et TM4.
6.2. Coloration de l’image
Consiste à colorer les trois images des trois canaux (R, G, B) et de les superposer.
6.3. Amélioration de l’image
Cette étape consiste à améliorer l’image obtenue de la coloration afin de faciliter
l’échantillonnage.
6.4. Échantillonnage
Le choix des échantillons est très important car il influe sur le résultat de la
classification.
6.5. L’apprentissage par l’AIS
L’apprentissage est constitué de toutes les étapes de l’algorithme de l’AIS en
commençant par le clonage, la mutation et l’évaluation de la nouvelle population jusqu’as ce
que le critère d’arrêt soit satisfait.
Dans ce bloc nous utilisons l’approche hybride proposée afin d’obtenir les meilleurs
poids.
6.6. L’apprentissage par MLP
Cette étape consiste à poursuivre l’apprentissage par l’algorithme de la rétropropagation du gradient dans le but de minimiser l’erreur globale, et de faire une mise à jour
des poids jusqu’à ce que le nombre d’itérations ou le seuil de l’erreur soit atteint.
6.7. La classification
Consiste a classé Chaque pixel de l’image dans sa classe approprié.
7. Application et Résultats
Au départ nous n’avions aucune connaissance sur les limites de notre approche, et
nous n’avions aucune idée sur les résultats qu’on pourrait obtenir, mais on savait que le choix
des paramètres jouerait un rôle important dans l’implémentation. La raison pour laquelle on a
entamé une série de tests qui nous permettront de choisir les paramètres finaux donnant de
meilleurs résultats.
58
Conception et implémentations
Note :
 Nombre des itérations de l’algorithme AIS : Nbr Ite AIS
 Nombre des itérations de l’algorithme MLP : Nbr Ite MLP
 Nombre de neurone de la couche cachée : Nbr Neur C C
 Nombre des populations a cloné : C
 Nombre de population remplacé : C*
 Taille de la population : P
 Erreur quadratique moyenne : EQM
 Temps d’exécution : T.Exe
 Nombre de classes trouvées : Nbr .C .T
 Mutation en mode réel : MLP-AIS
 Mutation en mode binaire : MLP-AISb
Pour la première série de test, au lieu de calculer le nombre de mutant par la formule de
l’algorithme CLONALG ou CLONCLASS, on a devisé le pourcentage de mutation en
intervalles comme suit :
Si 0,50 ≤ affinité<1,00 taux de mutation est de 3 %
Si affinité <0,50 : taux de mutation est de 10.00 %
Si -0.50 ≤ affinité <0,00 taux de mutation est de 15 %
Sinon alors le taux de mutation est de 20.0 %
Afin de déterminer les taux précédents nous avons effectuées plusieurs tests.
Le nombre des échantillons est fixé à 453 pixels distribués comme suit :
Figure IV. 3 : Image d’Oran ouest échantillonné 1
59
Conception et implémentations
Tableau IV. 1: Tableau Des Echantillons N°1
Dans cet essai on a implémenté l’approche hybride comme suit :
1- Initialement on a P populations constitué d’antigènes qui représente l’ensemble de
poids de tout le réseau.
2- Un nombre de populations qui ont les plus grandes affinités (erreur quadratique
moyenne minimale) seront clonées pour construire l’ensemble C.
3- Dans cette étape de mutation, on a deux cas :
A-MLP-AIS : Les antigènes (poids) de l’ensemble C subiront une mutation entre les
individus de la même population et constitueront un ensemble de populations C* selon leur
taux de mutation.
B-MLP-AISb : Tous Les antigènes de la population C subiront une transformation
en binaire et puis une mutation entre les différents bits selon le taux de mutation afin de
composé l’ensemble de populations C*.
4- Le nouveau ensemble de population obtenue C* sera évaluer c’est-à-dire on
calculera l’affinité de tous l’ensemble des populations C* et on compare les affinités de toutes
les populations (l’ensemble C* et l’ensemble P ) pour supprimer ceux qui ont les plus petites
affinités.
Pour finir une nouvelle population P* sera construite a partir de P et de C*. Cette
population deviendra la population initiale pour l’itération suivante et on retourne à l’étape 2.
7.1. Influence des paramètres
Dans le but de déterminer les paramètres les plus influant, nous avons lancés la série
de test suivante
60
Conception et implémentations
7.1.1. Influence des paramètres AIS
Pour ce premier essai, on a essayé d’éliminer totalement l’algorithme MLP en le
remplaçant par l’hybridation MLP-AIS, les autres paramètres ont été fixé comme suit :
A
B
P
100
100
C
4
24
C*
2
16
Nbr Neur C. C
12
12
Nbr Ite AIS
500
500
Nbr Ite MLP
00
00
Tableau IV. 2: Les paramètres fixés pour le premier essai
Pour les deux cas les résultats obtenus sont illustré dans le tableau suivant :
A
B
EQM
1.04615
1.04615
T.exe
12.14.06
14.01.00
1
1
Nbr C.T
Tableau IV. 3: Les résultats obtenus pour le premier essai
7.1.2. Influence des paramètres MLP
Dans ce deuxième essai on a appliqué seulement l’algorithme de la rétro propagation
du MLP composé des étapes suivantes
1- Initialement les poids du réseau sont généré aléatoirement dans un intervalle
de
2- La fonction Y de la couche cachée de chaque neurone est calculé.
3- Ensuite le calcul de la fonction de sortie de chaque neurone pour obtenir l’erreur
quadratique moyenne.
61
Conception et implémentations
4- En fonction de l’EQM le signal est rétro propager en avant pour modifié les poids
en suivant les fonctions expliqué dans l’algorithme de la rétro propagation du deuxième
chapitre.
A
B
P
100
100
C
6
6
C*
4
4
Nbr Neur C. C
8
12
Nbr Ite AIS
00
00
Nbr Ite MLP
500
500
Tableau IV. 4: Les paramètres fixés pour le deuxième essai
Pour les deux cas on a obtenu les résultats suivant :
A
B
EQM
0.18744
0.20571
T.exe
2.07.03
2.11.6
Nbr C.T
3
2
Tableau IV. 5: Les résultats obtenus par le deuxième essai
On a refait le même test avec 1000 itérations, les résultats obtenus sont les suivants :
A
B
EQM
0.18040
0.20946
T.exe
4.10.04
4.20.09
Nbr C.T
3
2
Tableau IV. 6: les résultats obtenus par le troisième essai
On a effectué les trois premiers essais, dans le but de choisir les paramètres adéquats
pour notre application. On a commencé par fixer le nombre d’itérations et le nombre de
populations, ensuite on a joué sur les autres paramètres pour pouvoir détecter le paramètre le
plus influant.
Les essais précédents nous ont permis de choisir le nombre de neurones de la couche
cachée et le nombre d’antigènes à cloner et à muter pour avoir des résultats optimaux.
62
Conception et implémentations
7.2. Hybridation MLP-AIS
7.2.1.1.
Test 1
Pour les trois cas le nombre des échantillons a été fixé a 453, pour les deux cas (A) et
(B) le type de mutation utilisé est la mutation réelle mais pour le troisième cas (C) la mutation
a été effectuée en binaire.
Les paramètres sont fixés pour ce test comme suit:
Cas « A »
Cas « B »
Cas « C »
P
100
100
100
C
8
24
24
C*
6
16
16
Nbr Neur C. C
8
8
8
Nbr Ite AIS
1000
1000
1000
Nbr Ite MLP
1000
2000
4000
Tableau IV. 7: Les paramètres fixés pour le test 1
On a obtenu les résultats suivants :
 Cas (A)
Figure IV. 4 : Image classifié du cas (A) test
1 MLP-AISb , EQM = 0.21853 ; TC = 24,52
Figure IV. 5 : Image classifié du cas(A) test
1 MLP- AIS , EQM = 0.20726; TC =19,23
63
Conception et implémentations
Les résultats illustrés dans les deux figures montrent l’apparition de plusieurs mais le
taux de classification a atteint 24.12 seulement avec trois bons classements seulement mer,
maquis et ressac mais beaucoup de confusion entre les autres classes. Donc on augmenter le
nombre d’itérations :
 Cas (B)
Figure IV. 6: Image classifié du cas (B)test 1 MLP- AISb , EQM = 0,19408 ; TC= 14,89
On a obtenu une amélioration dans la valeur de l’EQM mais les mêmes résultats de
classements c’est à dire les classes mer et maquis bien classé et la classe ressac a été confuse
avec la classe sebkha 1 et la classe mer mais la pluparts de ces pixels ont été reconnus.
On a pensé que la solution sera l’augmentation du nombre d’itérations donc on a
passé au test suivant :
64
Conception et implémentations

Cas ( C)
Figure IV. 7 : Image classifié du cas (C)test 1 MLP- AIS, EQM= 0,21486 ; TC=16,58
Malgré l’augmentation du nombre d’itérations, on a pas obtenu de meilleur résultat et
les confusions entre les différentes classes n’ont pas changer, donc on a essayé de changer la
base d’échantillonnage pour les tests suivants.
7.2.1.2.
Test 2
Pour le test 2 l’échantillonnage a été changé et les paramètres sont fixés comme suit :
A
B
C
P
100
100
100
C
8
8
8
C*
6
6
6
Nbr Neur C. C
8
8
8
Nbr Ite AIS
1000
100
1000
Nbr Ite MLP
1000
100000
100000
Tableau IV. 8: Les paramètres fixés pour le deuxième test
65
Conception et implémentations

CAS (A)
Figure IV. 8: Image classifié du cas (A) test
2 MLP- AIS, EQM= 0,23358 ; TC = 20,23
Figure IV. 9: Image classifié du cas (A) test
2 MLP- AISb , EQM = 0,27374; TC = 22,47
Les résultats illustrés dans les deux figures montrent une grande différence entre les
deux méthodes et l’intervalle de l’EQM entre les deux méthodes est considérable mais cela
n’a pas permis a trouvé toutes les classes.
Pour ce test les trois bons classements sont les classes mer, ressac et sebkha2 mais
beaucoup de confusion entre les autres classes.

CAS (B)
Figure IV. 10: Image classifié du cas (B)test 2 MLP- AIS, EQM = 0,29335; TC = 12,66
Ces résultats montrent l’apparition de plusieurs nouvelles classes qui ne sont pas bien
reconnus, ne donnant pas une amélioration dans la classification.

CAS (C)
66
Conception et implémentations
Figure IV. 11: Image classifiée(C)test 2 MLP- AIS, EQM =0.093; TC = 29,48
Les résultats illustrés dans la figure sont meilleur par rapport aux résultats obtenus
des tests précédents car L’erreur quadratique moyenne a beaucoup diminuer et trois nouvelles
classes ont été trouvées.
Après tous les tests effectués nous avons obtenue à chaque nouveau essai une petite
amélioration soit l’erreur quadratique moyenne du réseau diminue soit le nombre de classes
détecter augmente donc nous avons déduis que les résultats sont encourageant mais pas
satisfaisants pour autant. Nous avons remarqué que l’augmentation de nombre d’itérations a
engendré un sur-apprentissage pour certaines classes.
7.3. Hybridation MLP-CLONCLASS
Pour la deuxième série de test la fonction utilisée pour la mutation est la suivante :
Fonction MUT
{
Si( l’individu 1 ≠l’individu 2) alors
{ Si (l’individu 1 et l’individu 2)
M alors
Si individu 1 > 0 alors
Individu1 
.
Sinon Individu1 
Si individu 2 > 0 alors
67
–
.
Conception et implémentations
Individu2 
–
Sinon Individu1 
.
–
}
}
Où M : l’ensemble des individus mutés
7.3.1. Influence des paramètres
7.3.1.1.
Influence des nombre de populations
 Dans cette partie, on a fixé tous les autres paramètres et nous effectuons des
changements sur le nombre de populations utilisées. Les paramètres sont fixé comme
suit : (Nbr Ite AIS ,Nbr Ite MLP, Nbr Neur C C ,β)=(100,50,8,10)
Test
Nombre de population
MLP-AISB
MLP-AIS
1
500
0,29741
0,23108
2
100
0,23147
0,21678
3
50
0,22161
0,22505
4
25
0,21663
0,21728
Tableau IV. 9: Influence du nombre de population
Le tableau illustré montre une amélioration dans la valeur de l’erreur quadratique
moyenne avec la diminution du nombre de populations donc ce dernier influe directement sur
les résultats obtenus.
7.3.1.2.
Influence du coefficient β
Afin de déterminer l’influence du coefficient β utilisé dans la formule qui calcule le
nombre de clones on a fixés les paramètres suivants :
(Nbr Ite AIS ,Nbr Ite MLP, Nbr Neur C C ,P)=(100,50,8,25)
68
Conception et implémentations
Test
Coefficient β
MLP-AISB
MLP-AIS
1
8
0,22328
0,22574
2
5
0,19624
0,21711
3
2,5
0,22642
0,22983
4
0,05
0,22642
0,22983
Tableau IV. 10: Influence du nombre du coefficient β
Les résultats illustrés dans le tableau 4. 10 Sont instables pour les deux cas MLPAISB et MLP-AIS. Nous remarquons que pour les deux dernières valeurs nous avons obtenu
les mêmes résultats. Cela signifie que la diminution du coefficient β n’engendre pas
forcement l’obtention d’une meilleur erreur quadratique moyenne.
Influence du nombre d’itérations
7.3.1.3.
Dans les deux tableaux suivants nous allons jouer sur le nombre d’itérations des deux
algorithmes MLP et AIS « CLONCLASS », En premier lieu on a fixé le nombre d’itérations
du MLP et on a changé le nombre d’itérations de l’AIS. Les autres paramètres sont fixés
comme suit :
(NBR Ite MLP ,Nbr Neur C C ,P,coefficient β) = (50, 8,25, 5)
Test
Nbr ite AIS
MLP-AISB
MLP-AIS
1
100
0,19624
0,21711
2
150
0,23424
0,22971
3
200
0,29611
0,23078
4
300
0,29611
0,23845
Tableau IV. 11:Influence du nombre d’itération AIS
Dans dette deuxième étape on a fixé le nombre d’itérations de l’algorithme AIS a
100 itérations et on a augmenté le nombre d’itération MLP Les résultats sont illustrés dans le
tableau suivant :
69
Conception et implémentations
Test
Nbr ite MLP
MLP-AISB
MLP-AIS
1
100
0,18933
0,18052
2
200
0,17404
0,16068
3
300
0,14921
0,14919
4
500
0,14405
0,15220
Tableau IV. 12: Influence du nombre d’itération MLP
Les résultats illustrés dans les deux tableaux 4.11 Et 4.12 Indique que le nombre
d’itérations du MLP a une grande influence par rapport aux nombre d’itérations de l’AIS.
7.3.2. Test 3
Les paramètres sont fixés comme suit :
(NBR Ite MLP ,Nbr Ite AIS ,Nbr Neur C C , P, coefficient β) = (600,100, 8,25, 5)
Figure IV. 12: Image classifié du test
3MLP- AISB, EQM=0.15201 ; TC = 19.33
Figure IV. 13: Image classifié du test 3MLPAIS,EQM=0,14665; TC = 23,48
Les résultats obtenus dans les deux figures ne sont pas satisfaisants car nous n’avons
pas obtenue toutes les classes et seulement deux ont été bien classées mais les résultats
obtenus avec MLP-AIS restent meilleure que ceux obtenus par MLP-AISB
7.3.3. Test 4
Pour ce test nous avons augmenté le nombre d’itérations comme suit
70
Conception et implémentations
(NBR Ite MLP ,Nbr Ite AIS ,Nbr Neur C C , P, coefficient β) = (1000,100, 8,25, 5)
Figure IV. 14: Image classifié du test 4MLPAISB , EQM=0,15368 ; TC = 19.33
Figure IV. 15: Image classifié du test 4 MLPAIS , EQM=0,14082 ; TC = 23,48
Pour ce test nous avons obtenu de meilleurs résultats par rapport au test précédent, trois
classes ont été très bien classées, la confusion de la classe forêt avec la classe céréale a
diminué et on a remarqué l’apparition de deux nouvelles classes mais les résultats reste
toujours mauvais pour les deux cas MLP-AIS et MLP-AISB.
7.3.4. Test 5
(NBR Ite MLP ,Nbr Ite AIS ,Nbr Neur C C , P, coefficient β) = (2000,100, 8,25, 5)
Figure IV. 16: Image classifié du test 5MLPAISB ,EQM = 0.14604 ; TC = 17,08
Figure IV. 17: Image classifié du test 5MLPAIS , EQM = 0,13450 ; TC = 23,36
La différence entre ces deux figures apparait nettement. Et la classification avec
MLP-AIS est meilleur qu’avec MLP-AISB on a pu classer quatre classes (mer, ressac, forêt,
sebkha 1). L’erreur quadratique moyenne est toujours en diminution pour les deux
algorithmes MLP-AIS et MLP-AISB .
71
Conception et implémentations
7.3.5. Test 6
Pour ce test nous avons changé l’échantillonnage à 707 pixels, avec les paramètres
fixés comme suit(NBR Ite MLP ,Nbr Ite AIS ,Nbr Neur C C , P, coefficient β) = (
600,100, 8,25, 5), nous avons obtenu les résultats suivants :
Figure IV. 18: Image classifié du test 6MLPAISB ,EQM = 0.10036 ; TC = 12,24
Figure IV. 19: Image classifié du test 6MLPAIS , EQM =0.13420 ; TC = 16,66
Les résultats obtenus dans ce test sont très différents des résultats obtenus
précédemment, on remarque l’apparition de plusieurs nouvelles classes mais qui sont mal
classés. Les rôles entre le MLP-AIS et le MLP-AISB sont inversé car on a obtenu des
meilleurs résultats avec le MLP-AISB
Les résultats des tests illustrés dans les figures précédentes sont obtenues en
changeant quelque paramètres seulement tel que le nombre d’itération MLP ou
l’échantillonnage, et on a remarqué la différence qui apparait d’un test a l’autre donc nous
concluant que ces deux paramètres jouent des rôles très importants dans les résultats .
Les résultats des tests en générale sont insatisfaisants cela peut être dus à la mauvaise
prise des échantillons ou bien aux mauvais choix des autres paramètres.
Malgré la diminution de l’erreur quadratique moyenne les résultats de classifications
obtenus ne sont pas satisfaisants donc on a pu constater que l’EQM n’est pas un critère de
validation à partir duquel on peut obtenir de bonnes classifications.
72
8. Conclusion
Ce chapitre a été consacré à l’implémentation et l’illustration des résultats obtenus
des tests effectués. Ces tests ont été appliqué sur une image satellitale afin d’obtenir un bon
résultat de classification.
L’application réalisée nous a permis de pratiquer deux méthodes différentes la
première est la méthode MLP-AISb dont la mutation des poids s’effectue en binaire et la
deuxième méthode MLP-AIS dont les poids subissent une mutation en mode de présentation
réel.
L’importance de l’opération de mutation nous a encouragés à modifier dans le
concept de celle-ci, premièrement le taux de mutation a été partagé sur plusieurs intervalles
selon la valeur de l’affinité du réseau, ensuite ce taux a été calculé par la formule de
l’algorithme CLONCLASS.
On peut partager les tests effectués en trois groupes le premier groupe des tests a été
le déterminant des paramètres adéquats aux meilleurs résultats.
Le deuxième groupe de tests a été effectué avec la première méthode de mutation,
c'est-à-dire par palier avec deux échantillonnages différents, ensuite le troisième groupe avec
le système hybride MLP-CLONCLASS.
Les résultats issus des deux méthodes ne sont pas assez différents et ceux obtenus
dans la mutation par palier sont meilleurs que ceux obtenus par le MLP-CLONCLASS mais
ils restent toujours insuffisants.
73
Conclusion générale
Notre travail a été consacré au traitement des données optiques issues du mécanisme
de la télédétection (image satellitaire) par une hybridation entre deux méthodes bio-inspirées,
le réseau de neurone de type perceptron multicouche optimisé par un système immunitaire
artificiel.
Pour le système immunitaire artificiel nous avons choisie l’algorithme CLONCLASS
grâce à ces performances dans la reconnaissance des formes. Le mécanisme utilisé permet de
reconnaitre rapidement les formes déjà rencontré
et mémorise des nouvelles formes
inconnues.
La méthode hybride entre l’algorithme CLONCLASS de l’AIS et l’algorithme du
MLP a permis de profiter des avantage de l’un et de l’autre tels que la mémorisation pour
l’AIS et la généralisation pour le MLP.
Dans le développement de notre approche on a gardé l’architecture du réseau MLP et
introduit l’algorithme CLONCLASS pour remplacer celui de la rétro-propagation qui calcul
les poids de toutes les couches.
L’utilisation de l’AIS en début d’algorithme a facilité l’apprentissage pour le MLP
mais nous avons rencontré beaucoup de problèmes tels que les choix des paramètres et
l’échantillonnage.
Les deux méthodes de mutation ont engendré la réduction de l’intervalle dans lequel
les poids du réseau changent.
Les tests des deux méthodes MLP-AISB et MLP-AIS nous ont permis de déduire que
l’approche utilisé dans l’optimisation des réseaux de neurones de type MLP n’est pas la
bonne, car le déroulement de l’algorithme nous a pris beaucoup de temps sans aboutir à une
bonne classification donc les résultats obtenus sont insatisfaisants.
Comme perspectives nous proposons le changement du principe de modélisation de
CLONCLASS (partager la base d'apprentissage en plusieurs blocs de pixels ou chaque bloc
représente un antigène) ou bien d’utiliser l’algorithme de l’AIS de façon différente, c’est-à-
74
dire à la fin de la rétro-propagation et non pas au début ou bien de changer complètement
l’algorithme de CLONCLASS par la sélection négative ou l’AINET…. .
Nous proposons aussi d’ajouter d’autres paramètres d’entrées déterminant pour le
réseau tel que la variance.
75
Bibliographie
76
Bibliographie
[1] : Amir Mokhtar HANNANE, « optimisation des réseaux de neurones par
algorithmes de colonies de fourmis pour la segmentation des images satellitaires »,
PFE ,USTO , Oran , Algérie 2008.
[2] : Mohammed SOUABI et Mustapha SI-TAYEB « conception d’un système
hybride neuro markovien RN-MLP & MRF pour la classification des images satellitaires,
PFE , USTO, Algérie 2006.
[3] : MINVIELLE et SOUIAH ; Livre : L’analyse statistique et spatiale :
Statistiques, cartographie, télédétection, SIG ; 2003 ; Roubin ,1995
[4] : Vincent POULAIN1, Jordi INGLADA1, Marc SPIGAI2, Jean-Yves
TOURNERETE, Philippe MARTHON3, « Utilisation d’images satellites haute résolution
optique et radar pour la mise `a jour de bases de données cartographiques », IEEE Signal
Processing Letters, Centre National d’ Etudes Spatiales, Toulouse, France ; 2009.
[5] : S.FASLA, M.A.MESSAOUDI « Classification multisources des images
satellitaires par les réseaux de neurone RBF(ols) avec l’intégration des données
photographiques et radar » ; PFE ; USTO ; Oran ; Algérie ; 2006.
[6] : G. CELEUX, E. DIDAY, G. GOVAERT, Y. LECHEVALLIER et H.
RALAMBONDRAINY, « Classification automatique des données » ; Bordas ; Dunod ; 1989.
[7] : Smaine El KAHILI Boumediene, G.BOUDOUR « Conception d’un système
hybride, algorithme génétique et réseau RBF pour une classification d’image satellitaire »,
PFE ; USTO ; Oran, Algérie, 2004.
[9]: Mohammed SALEM, « Maintenance Industrielle Par Réseaux De Neurones »,
Mémoire De Magister ; Centre Universitaire Mustapha Stambouli Mascara Institut
D’Informatique, Algérie,2006.
[10]: Zahra ZERDOUMI, « Application des réseaux de neurones artificiels à la
poursuite des non linéarités fluctuantes des systèmes satellitaires »,mémoire de magister
Université MOHAMED BOUDIAF ; M’sila, Algérie 2006.
[11] : Fatiha DJAHAFI et Rachida BENZEKRI, « Développement du Système
Immunitaire Artificiel pour le diagnostic des maladies cancéreuse », PFE ; USTO, Algérie
2009.
[12] : Marc PARIZEAU, « réseaux de neurones » ; Livre ; Université de Laval ;
Automne 2004.
[13] :
Chahinez
Mériem
BENTAOUZA
&
Mohammed
Amine
RIFFI
« Classification automatique des images satellitaires par les réseaux de neurones
MLP » ; PFE ;USTO, Algérie ; 2003
[14] : Ecole de Technologie Supérieure, « Perceptron Multicouche », Université du
Québec, ENST Bretagne.
[15] : HADJDJELLOUL ABBASSIA & SOURI KARIMA, « traitement des
images Mammographiques par la méthode AIS » ; Mémoire De Master ; USTO MOHAMED
BOUDIAF , 2010.
[16] : Hiba KHELIL, « Application des systèmes immunitaires artificiels pour la
reconnaissance des formes », publié : MCSEAI-2008 ; USTO MOHAMED BOUDIAF,
Oran, Algérie 2007.
[17] : Mokhtar GHARBI, « Optimisation grâce aux systèmes immunitaires
artificiels », Mémoire De Master2 ; Centre Européen de Réalité Virtuelle EA.3883 .
EBV ,2006.
[18] : Nadjib GUETTARI « application des systèmes immunitaires artificiels aux
images médicales », Mémoire De Magister ; USTO , Algérie 2010.
[19] : J.P REVILLARD, « Immunologie », Livre ; université de Boeck, 2001.
[20] Yanfei ZHONG, Liangpei Zhang Jianya GONG, Pingxiang LI ,«A Supervised
Artificial Immune Classifier for Remote-Sensing Imagery», IEEE transactions on geoscience
and remote sensing, December 2007.
[21] : Yahia CHABANE, « élaboration d’un contrôleur adaptatif pour un robot
mobile basé sur les réseaux immunitaires artificiels », Mémoire De Magister , USDB
(Université Saad Dahlab, Blida, Algérie, 2006.
[22] : A. DENECHE, S. MESHOUL, M. BATOUCHE, « Une approche hybride
pour la reconnaissance des formes en utilisant un Système Immunitaire Artificiel »,
Université Mentouri, Constantine ; Algérie, 2007.
[23] : Ines LABED, «Proposition d’un système immunitaire artificiel pour la
détection d’intrusions », Université Mentouri De Constantine,Algérie, 2006.
[Net 1] : Guy ALMOUZNI ; « Traitement numérique des images », 2012. Tipoly.pdf
[Net2] :
classification
supervisée
http://prisma.insa-
lyon.fr/[email protected]
[Net 3] : http://www.img.univ-mlv.fr/dr/XPOSE2002/neurones
[Net 4] : Réseau de neurones : http://fr.wikipedia.org/wiki
[Net 5] : Le système immunitaire cellules, molécules et organes de l’immunité » :
http://_SYSTEME IMMUNITAIRE.htm.
[Net6] :
« Le
système
immunitaire :
qu’est
ce
que ? » :
http://
www.passportsante.net/fr/maux/problemes/articleinteret.aspx?doc=comprendre_systeme_
immunitaire_mantha_2004_pm.
[Net7] :« Encodage » :http://fr.wikipedia.org/wiki/Algorithmeg%C3%A9n%C3%A9
tique.
Résumé :
Les images satellitaires à l’état brut sont bruitées, peu contrasté et difficilement
exploitables, c’est la raison pour la quelle on effectue sur ces images des prétraitements et des
traitements tel que la classification et la segmentation afin de mieux les exploiter. Dans notre
étude nous nous intéressons aux traitements des donnés optiques issus de la télédétection
spécifiquement la classification des différents pixels d’une image satellitaire on utilisant un
modèle hybride entre deux méthodes bio-inspirées. Le principe de notre
d’optimiser les réseaux de neurone de type perceptron multicouche
approche est
par un système
immunitaire artificiel afin d’essayé de palier les limitations des deux approches.
Mots clés : données optiques, télédétection, classification, réseaux de neurones perceptron
multicouche, systèmes immunitaires artificiels.
Abstract :
In their original form the Remote sensing images are noisy, low contrasted and
difficult to use it is the reason for which they rescuer a pretreatment and a treatment as
segmentation and classification to exploit them better. Our study is focused on treatment of
optical data
which is results from the remote sensing specifically in the classification of
different pixels of a remote sensing image using a hybrid model of two bio-inspired methods.
The objective of our approach is to optimize a neuronal network (multiple layer preceptors)
by an artificial immune system to mitigate the limitations of both approaches.
Key words : optical data, remote sensing, classification, neuronal network(multiple layer
preceptors), artificial immune system.
Téléchargement