Université des sciences et de la technologie d'Oran Mohamed Boudiaf Faculté de mathématique et informatique Département d’informatique Option : Télédétection, Analyse et Traitement Informatique des Données Spatiales Spécialité: Informatique Mémoire présenté par: NOUICER Imene Eps. MADJOUB Pour l'obtention du diplôme de MAGISTER Thème: Optimisation des réseaux de neurones par l’AIS pour le traitement des données optiques Soutenu publiquement le: 19 / 01 / 2014 (à 14h00 la salle des soutenances) Devant le jury: Président Mr BENYETTOU Abdelkader Professeur USTO(MB) Rapporteur Mme FIZAZI Hadria professeur USTO(MB) Examinateur Mr BELKADI Khaled Maitre de conférences USTO(MB) Examinatrice Mme CHOURAQUI Samira Maitre de conférences USTO(MB) Examinateur Mr YOUCEFI Djaffar Chargé de recherche C.T.S (ARZEW) Table des matières Introduction générale Chapitre I :Télédétection et classification 1. 2. 3. Introduction .................................................................................................. 3 Définition de la télédétection ....................................................................... 3 Terme Essentielles En Télédétection ........................................................... 3 3.1. 3.2. 3.3. 3.4. 3.5. 3.6. 4. Principe de la télédétection .......................................................................... 4 4.1. 4.2. 4.3. 5. Emission d’un rayonnement .............................................................................. 5 Interaction avec l’atmosphère ........................................................................... 5 Interaction avec la cible ..................................................................................... 6 Enregistrement de l’énergie par le capteur ..................................................... 6 Transmission de l’énergie .................................................................................. 6 Interprétation et analyse .................................................................................... 6 Application .......................................................................................................... 6 Le rayonnement électromagnétique ............................................................ 7 6.1. 6.2. 6.3. 6.4. 6.5. 7. 8. 9. La source d’énergie ............................................................................................ 5 La cible ................................................................................................................ 5 Le vecteur ............................................................................................................ 5 Le processus de la télédétection ................................................................... 5 5.1. 5.2. 5.3. 5.4. 5.5. 5.6. 5.7. 6. Capteurs .............................................................................................................. 3 Image ................................................................................................................... 4 Image numérique................................................................................................ 4 Image multi spectrale ......................................................................................... 4 Pixel ..................................................................................................................... 4 Source .................................................................................................................. 4 Définition ............................................................................................................. 7 Le champ électrique (E) ..................................................................................... 7 Le champ magnétique (M) ................................................................................ 7 Les caractéristiques du REM ............................................................................ 7 Propriétés des rayonnements électromagnétique ............................................ 8 Le spectre électromagnétique..................................................................... 10 La signature spectrale ................................................................................ 12 Type des Systèmes d’acquisition ................................................................ 12 9.1. 9.2. 9.3. Télédétection passive (visible, infrarouge) ..................................................... 12 Télédétection passive (infrarouge et micro-onde) ......................................... 12 Télédétection actif ............................................................................................ 13 10. Les satellites ................................................................................................ 13 10.1. 10.2. Satellite géostationnaire ................................................................................... 13 Satellite héliosynchrone ................................................................................... 14 11. Données optiques........................................................................................ 16 12. Image satellitaire ........................................................................................ 17 12.1. Caractéristique des images satellitaires ......................................................... 17 13. Prétraitement .............................................................................................. 19 13.1. 13.2. 13.3. Réduction de bruit ............................................................................................ 19 Rehaussement ................................................................................................... 20 Transformation de l’image .............................................................................. 20 14. Traitement ................................................................................................... 20 14.1. 14.2. Segmentation..................................................................................................... 20 Classification ..................................................................................................... 20 15. Conclusion .................................................................................................. 21 Chapitre II : Les réseaux de neurones 1. 2. 3. 4. Introduction ................................................................................................ 22 Le modèle neurophysiologique .................................................................. 22 Le modèle mathématique ........................................................................... 23 Structures d'interconnexion ...................................................................... 25 4.1. 4.2. 4.3. 4.4. 5. Apprentissage.............................................................................................. 27 5.1. 5.2. 5.3. 5.4. 6. 7. Notion d’apprentissage .................................................................................... 27 Apprentissage supervisé .................................................................................. 27 Apprentissage non supervisée ......................................................................... 28 Les règles d’apprentissage ............................................................................... 28 Généralisation ............................................................................................ 29 Le modèle MLP .......................................................................................... 29 7.1. 7.2. 8. Réseau multicouches ........................................................................................ 25 Réseau à connexions locales ............................................................................ 26 Réseau à connexions récurrentes .................................................................... 26 Réseau à connexion complète .......................................................................... 27 Algorithme du MLP ......................................................................................... 30 Domaine d’application ..................................................................................... 32 Conclusion .................................................................................................. 32 Chapitre III : Les systèmes immunitaires 1. 2. Introduction ................................................................................................ 33 Système immunitaire naturel ..................................................................... 34 2.1. 2.2. 2.3. 2.4. 2.5. Immunité naturelle ........................................................................................... 34 Définition d’antigène ........................................................................................ 34 Composant du système immunitaire naturel ................................................. 35 Fonctionnement ................................................................................................ 38 Les maladies du système immunitaire ............................................................ 39 3. Le système immunitaire artificiel .............................................................. 40 3.1. 3.2. 4. Les notions de bases du système immunitaire artificiel ................................ 40 Les algorithmes du système immunitaire artificiel ....................................... 42 Conclusion .................................................................................................. 51 Chapitre IV : Conception et Implémentations 1. 2. 3. 4. Introduction ................................................................................................ 52 Ressource et matériels utilisées ................................................................. 52 Données expérimentale .............................................................................. 52 Approche hybride proposé ......................................................................... 53 4.1. 4.2. 4.3. 4.4. 4.5. 4.6. 4.7. 5. 6. Déroulement de l’algorithme ..................................................................... 56 Schéma de l’application ............................................................................. 57 6.1. 6.2. 6.3. 6.4. 6.5. 6.6. 6.7. 7. Chargement des images brutes ....................................................................... 58 Coloration de l’image ....................................................................................... 58 Amélioration de l’image................................................................................... 58 Échantillonnage ................................................................................................ 58 L’apprentissage par l’AIS ............................................................................... 58 L’apprentissage par MLP ............................................................................... 58 La classification ................................................................................................ 58 Application et Résultats .............................................................................. 58 7.1. 7.2. 7.2. 8. Introduction ...................................................................................................... 53 Population ......................................................................................................... 53 Mesure d’affinité .............................................................................................. 53 Le clonage.......................................................................................................... 54 Mutation ............................................................................................................ 54 Evaluation de la nouvelle population ............................................................. 55 Les opérations du MLP : ................................................................................. 55 Influence des paramètres ................................................................................. 60 Hybridation MLP-AIS ………………………………….……………………63 Hybridation MLP-CLONCLASS ................................................................... 67 Conclusion .................................................................................................. 73 Conclusion générale Bibliographie Table des figures et tableaux Chapitre I : Télédétection et classification Figure I. 1: Le principe de la télédétection ............................................................................. 5 Figure I. 2: Les étapes du processus de la télédétection ......................................................... 6 Figure I. 3: Le rayonnement électromagnétique .................................................................... 8 Figure I. 4:Interactions du rayonnement électromagnétique avec la matière. (Absorption, réflexion, transmission)............................................................................................................. 9 Figure I. 5 :Phénomène de réfraction ................................................................................... 10 Figure I. 6: Le spectre électromagnétique ............................................................................ 10 Figure I. 7: La signature spectrale des surfaces naturelles. ................................................ 12 Figure I. 8: Utilisation du rayonnement électromagnétique en télédétection ..................... 13 Figure I. 9: Satellite géostationnaire ..................................................................................... 14 Figure I. 10: Satellite héliosynchrone ................................................................................... 14 Figure I. 11: Résolution spatiale des images du Quickbird (Document Digital Globe 2008) ..... 18 Figure I. 12: Résolution radiométrique des images(Document CCRS/CCT) ...................... 19 Tableau I. 1: Caractéristiques et applications des bandes spectrales du capteur TM. ......... 16 Chapitre II : Les réseaux de neurones Figure II. 1: Neurone biologique avec son arborisation dendritique [Net 3]....................... 23 Figure II. 2 : Neurone artificiel .............................................................................................. 24 Figure II. 3: Neurone formel .................................................................................................. 24 Figure II. 4: Différents types de fonctions de transfert pour le neurone artificiel. [1] ........ 25 Figure II. 5: Réseau multicouches ......................................................................................... 25 Figure II. 6: Réseau à connexions locales ............................................................................. 26 Figure II. 7: Réseau à connexions récurrentes ..................................................................... 26 Figure II. 8 : Réseau à connexion complète .......................................................................... 27 Figure II. 9: Apprentissage Supervisé .................................................................................... 28 Figure II. 10: Apprentissage non Supervisé .......................................................................... 28 Figure II. 11: Architecture D’un Perceptron Multicouches avec deux couches cachées. ... 30 Tableau II . 2 :La loi de Hebb................................................................................................. 29 Tableau II . 3 : La règle de delta ............................................................................................ 29 Chapitre III : Les systèmes immunitaires Figure III. Figure III. Figure III. Figure III. Figure III. Figure III. Figure III. 1: Les cellules du système immunitaire naturel ................................................. 35 2: Cellule granulocytes ........................................................................................ 35 3: Cellule monocyte.……………………………………………………………36 4: Cellule macrophage ........................................................................................ 36 5: Cellule lymphocyte B ...................................................................................... 36 6: Cellule lymphocyte T ....................................................................................... 36 7 : Structure D’un Anticorps .............................................................................. 37 Figure III. Figure III. Figure III. Figure III. Figure III. Figure III. Figure III. 8: Représentation des données binaire ............................................................... 40 9: Représentation des données réelles ................................................................ 40 10: Représentation des données sous forme arborescence [Net 7] ................... 41 11: L’algorithme de la sélection négative ........................................................... 43 12: Pseudo-code de l’algorithme de la sélection négative. [22] ......................... 44 13: L’algorithme de la sélection clonale ............................................................ 47 14: Pseudo-code de l’algorithme de la sélection clonale. .................................. 48 Tableau III. 1 : Comparaison entre la réponse primaire et secondaire .............................. 39 Chapitre IV : Conception et Implémentations Figure IV. Figure IV. Figure IV. Figure IV. Figure IV. Figure IV. Figure IV. Figure IV. Figure IV. Figure IV. Figure IV. Figure IV. Figure IV. Figure IV. Figure IV. Figure IV. Figure IV. Figure IV. Figure IV. 1: Image d’Oran ouest prise par LANDSAT5 .................................................... 53 2: Organigramme de l’application ...................................................................... 57 3 : Image d’Oran ouest échantillonné 1 ............................................................. 59 4 : Image classifié du cas (A) test 1 MLP-AISb , EQM = 0.21853..……..……63 5 : Image classifié du cas(A) test 1 MLP- AIS , EQM = 0.20726 ...................... 63 6: Image classifié du cas (B)test 1 MLP- AISb , EQM = 0,19408 ....................... 64 7 : Image classifié du cas (C)test 1 MLP- AIS, EQM= 0,21486 ........................ 65 8: Image classifié du cas (A)test 2 MLP- AIS, EQM= 0,23358.……………….66 9: Image classifié du cas (A) test 2 MLP- AISb , EQM = 0,27374 ..................... 66 10: Image classifié du cas (B)test 2 MLP- AIS, EQM = 0,29335 ...................... 66 11: Image classifiée(C)test 2 MLP- AIS, EQM =0.093 ...................................... 67 12: Image classifié du test 3MLP- AISB, EQM=0.15201 …………………….70 13: Image classifié du test 3MLP- AIS,EQM=0,14665 ...................................... 70 14: Image classifié du test 4MLP- AISB , EQM=0,15368………………..……71 15: Image classifié du test 4 MLP- AIS , EQM=0,14082 .................................. 71 16: Image classifié du test 5MLP- AISB ,EQM = 0.14604 ................................. 71 17: Image classifié du test 5MLP- AIS , EQM = 0,13450 .................................. 71 18: Image classifié du test 6MLP- AISB ,EQM = 0.10036 ................................. 72 19: Image classifié du test 6MLP- AIS , EQM =0.13420 ................................... 72 Tableau IV. Tableau IV. Tableau IV. Tableau IV. Tableau IV. Tableau IV. Tableau IV. Tableau IV. Tableau IV. Tableau IV. Tableau IV. Tableau IV. 1: Tableau Des Echantillons N°1 ..................................................................... 60 2: Les paramètres fixés pour le premier essai .................................................. 61 3: Les résultats obtenus pour le premier essai.................................................. 61 4: Les paramètres fixés pour le deuxième essai ............................................... 62 5: Les résultats obtenus par le deuxième essai ................................................. 62 6: Les résultats obtenus par le troisième essai.................................................. 62 7: Les paramètres fixés pour le test 1................................................................ 63 8: Les paramètres fixés pour le deuxième test .................................................. 65 9: Influence du nombre de population ............................................................. 68 10: Influence du nombre du coefficient β ........................................................ 69 11:Influence du nombre d’itération AIS .......................................................... 69 12: Influence du nombre d’itération MLP ....................................................... 70 Remerciements Ce travail a été effectué au laboratoire SIMPA de l’Université des Sciences et de la Technologie d’Oran (U.S.T.O.M.B). Nous exprimons notre profonde reconnaissance au professeur FIZAZI.H qui nous a suivi durant toutes notre formation, nous tenons à lui exprimer toute notre estime pour son soutien aussi bien sur le plan scientifique que humain. Nous remercions le Professeur BENYETTOU .A de l’université des Sciences et de la Technologie d’Oran MB, qui nous a bien fait l’honneur d’être président de notre jury, nous lui exprimons nos sincères remerciements. Nous remercions personnellement madame CHOURAQUI .S et Messieurs BELKADI .K , De l’université des Sciences et de la Technologie d’Oran MB , ainsi que monsieur YOUCEFI.D du centre de recherche CNTS d’ARZEW pour avoir accepté d’examiner ce travail, et de faire partie de ce jury. En fin, que l’ensemble des personnes que nous avons eu le plaisir de côtoyer, trouvent en ces quelques mots le témoignage de notre reconnaissance pour leur sympathie et leur accueil chaleureux. Dédicaces Je dédie ce modeste travail ; A mon cher et tendre époux pour toute sa compréhension, son aide et son amour qui ont illuminé mon chemin à chaque fois que je perdais l’espoir. Je lui exprime ma gratitude et mon amour pour son encouragement durant tout ce temps. A ma très chère poupée IBTIHALE. A mes très chers parents qui ont tant prié pour moi, qui voient aujourd’hui l’un de leurs rêves se réalisé. Je les remercie pour leur affection, encouragement. A mes beaux parents pour toute la compréhension et l’aide qui m’ont procuré. A mon frère, mes sœurs, mon beau frère et ma belle sœur d’avoir toujours été là quand j’en avais besoin, ainsi que de leur appuis et leur affection. A sou sou, ma meilleur amie et ma source d’énergie, qui me bouscule a chaque fois. A Ishak A Nourhanne, Marwa, Abderrahmane, Aminou , Chaymoua et Youcef A toute ma famille, ma grand mère mes tantes et leur enfants. A tous mes amis(es), avec qui je partage ou bien j’ai partagé des instants gravé à toujours dans mon cœur. Imene Introduction générale Afin de faciliter son mode de vie, l’être humain créa plusieurs sciences et développa divers outils. L’informatique est considérée comme l’une des récentes sciences servant à régler les différents problèmes de la vie quotidienne. La nouveauté et l’efficacité de cette science lui a permis de s’intégré dans tous les domaines, mathématique, biologie, médecine, géographie …etc. Ces outils lui ont permis de surmonter tous types de difficultés, tels la gestion des bases de données médicale, les réseaux commandant la signalisation routière, et le traitement des images, de son et de paroles utilisé dans la conception des systèmes de sécurités ….etc. L’objectif de notre étude est le traitement des données optiques obtenues par la télédétection. Plusieurs recherches ont été orienté vers la classification des images satellitaires, vue l’intérêt de leurs utilisation dans les différents domaines, comme l’agriculture, la foresterie, la géologie et la cartographie ….etc. L’objectif de ces recherches est de trouver la méthode la plus rapide avec un taux d’erreur minime. De nos jours, la majorité des méthodes implémentées sont inspirées du corps humain, spécifiquement de son mode de fonctionnement, appelés méthodes bio-inspirées. L’une des premières modélisations de la biologie en informatique est les réseaux de neurone artificiels, qui a suscité l’intérêt de plusieurs recherches et découvertes. Divers autres méthodes son inspirèrent tels les algorithmes génétiques, les systèmes immunitaires artificiels, l’essaim particulier et les colonies de fourmis. Les recherches développées dans la classification des images satellitaires ont incité les chercheurs à optimiser les résultats des algorithmes développés anciennement. Dans Notre étude, on opta pour l’optimisation des réseaux de neurones artificiels par une autre méthode bio-inspirée « les systèmes immunitaires artificiels ». 1 Ce mémoire est constitué des quatre chapitres suivants : Le premier chapitre introduit les notions de base des images, les techniques d’acquisition ainsi que le processus de télédétection permettant l’obtention des données optiques. Le second chapitre est consacré à la définition du neurone formel, ensuite à éclaircir le mode de fonctionnement des réseaux de neurones naturelle et artificiels, alors nous aborderons les différents types de réseaux de neurones artificiels, plus spécifiquement le perceptron multi couche avec l’algorithme de la rétro-propagation. La troisième partie de ce mémoire développe les systèmes immunitaires biologiques, ces différentes maladies auto-immunes, les Systèmes Immunitaires Artificielles (AIS), en détaillant les différents algorithmes apparus, comme la sélection négative et la sélection clonale. Le dernier chapitre explique le concept des méthodes proposées de l’approche hybride entre les réseaux de neurone MLP et les systèmes immunitaires artificiels ainsi que la discussion des différents résultats obtenus de chaque implémentation. 2 Chapitre 1 Télédétection et classification Télédétection et classification Télédétection et classification 1. Introduction La technique de télédétection a vu le jour au début des années 60 aux États-Unis pour désigner la détection à distance avec les premières photographies aériennes prisent depuis un ballon. Depuis, elle inspire les chercheurs des différents domaines. Après le lancement du premier satellite LANDSAT1 en 1972, plusieurs d’autres lui ont succédé. De nos jours presque tous les pays possèdent leur propre satellite. Cette évolution conduisit à imager de plus en plus de région, jusqu'à la couverture intégrale de la terre entière.[1][2] 2. Définition de la télédétection Le terme télédétection est composé de deux mots : Télé signifiant « à distance » et détection veut dire « découvrir » ou « déceler ». Elle est définie comme la technique permettant l’acquisition des différentes caractéristiques physiques et biologiques d’un objet à partir d’un ensemble de connaissance scientifique et d’opérations sans entrer en contact direct (matériel) avec lui.[1][2] La Commission interministérielle de terminologie de la télédétection aérospatiale, l’a défini comme suit en 1988 : « Ensemble des connaissances et techniques utilisées pour déterminer des caractéristiques physiques et biologiques d’objets par des mesures effectuées à distance, sans contact matériel avec ceux-ci. » 3. Terme Essentielles En Télédétection 3.1. Capteurs Ils sont les appareillages responsable du recueille et de la mesure du rayonnement incident des différents objets observés pour le transformer en un signal enregistré sous forme numérique. Le type et les caractéristiques du capteur (résolution spectrale, radiométrique..) dépendent de l’application.[Net1] 3 Télédétection et classification 3.2. Image Est un tableau rectangulaire d’éléments (pixels) de même dimension possédant un ou plusieurs attributs codés numériquement, chaque image est caractérisé par sa structure et son format. Le capteur et son mode de fonctionnement définissent la structure de l’image et le mode d’enregistrement indique le format de l’image. 3.3. Image numérique Est la représentation de l’image par un nombre fini de points discrets. Chaque cellule de la matrice spatiale reçoit une valeur numérique (par exemple entre 0 et 255) qui représente les niveaux de brillance de l’image.[Net 1] 3.4. Image multi spectrale Est un ensemble de données obtenus simultanément, à condition que chaque ensemble se trouvant dans une région différentes du spectre électromagnétique. 3.5. Pixel Le pixel est le plus petit élément constituant l’image, la valeur du pixel résulte d’une intégration à la fois spatiale et spectrale.[Net 1] 3.6. Source C’est l’objet ou le système qui produit le rayonnement interagissant avec la cible observée mesuré par le capteur. 4. Principe de la télédétection La télédétection est le résultat d’interaction de trois éléments fondamentaux : une source d’énergie, une cible et un vecteur (un satellite ou un avion).[1][2] 4 Télédétection et classification Figure I. 1: Le principe de la télédétection 4.1. La source d’énergie Est l’élément qui éclaire la cible en émettant des ondes électromagnétiques, généralement le soleil. Cependant le radar n’as pas besoin d’une source d’énergie. 4.2. La cible Est la partie visée par l’observation de la terre. 4.3. Les vecteurs Sont les capteurs qui mesurent l’énergie (le rayonnement électromagnétique) réfléchit par la cible. Ils existent plusieurs types de capteurs tel que : Les avions, les satellites... 5. Le processus de la télédétection Comprend sept étapes : 5.1. Emission d’un rayonnement A la provenance de tout processus de télédétection se trouve nécessairement une source d’énergie pour illuminer la cible en émettant une onde électromagnétique. 5.2. Interaction avec l’atmosphère Le rayonnement interagit avec l’atmosphère, durant son parcours entre la source d’énergie et la cible et entre la cible et le capteur. 5 Télédétection et classification 5.3. Interaction avec la cible Une fois parvenue à la cible, l’énergie interagit avec la surface de celle-ci, cette interaction dépend des caractéristiques du rayonnement et des propriétés de la surface. 5.4. Enregistrement de l’énergie par le capteur Le vecteur ou plate-forme de télédétection capte l’énergie réfléchie par la cible, pour être enfin enregistrée. 5.5. Transmission de l’énergie L’énergie enregistrée par le capteur est transmise souvent par des moyens électroniques à une station de réception ou l’information est transformée en images numériques, ou photographiques. 5.6. Interprétation et analyse Pour mieux interpréter la cible et pour découvrir ces aspects, une interprétation visuelle et/ou numérique de l’image traitée est nécessaire, pour extraire l’information que l’on désire obtenir sur la cible. 5.7. Application La dernière étape du processus consiste à utiliser l’information extraite de l’image pour mieux comprendre la cible. 4 2 1 1 2 2 5 3 7 6 Figure I. 2: Les étapes du processus de la télédétection 6 Télédétection et classification 6. Le rayonnement électromagnétique 6.1. Définition Le rayonnement électromagnétique (REM) est le moyen porteur de l’information sur les objets détectés, il est défini comme l’énergie qui se propage dans l’espace ou dans la matière sous forme de champs électriques et magnétiques perpendiculaires entre eux. 6.2. Le champ électrique (E) Varie en grandeur et est orienté de façon perpendiculaire à la direction de propagation du rayonnement. 6.3. Le champ magnétique (M) Orienté de façon perpendiculaire au champ électrique. Les deux champs se déplacent à la vitesse de la lumière (C). 6.4. Les caractéristiques du REM Le rayonnement électromagnétique a les caractéristiques suivantes 6.4.1. La longueur d’onde λ Équivalant à la longueur d’un cycle d’une onde, c’est-à-dire la distance entre deux crêtes successives d’une onde. Mesurée en mètre 6.4.2. La fréquence f Représente le nombre d’oscillation par unité de temps. Elle est mesurée en hertz. La période t où La célérité de la lumière C où C = λ.f 7 Télédétection et classification Figure I. 3: Le rayonnement électromagnétique 6.5. Propriétés des rayonnements électromagnétique 6.5.1. Emission Tout corps dont la température est supérieure au zéro absolu (0° Kelvin équivaut à 273°C) émet un rayonnement électromagnétique issu de l’agitation thermique des molécules, dont la longueur d’onde est fonction de la température. Emission et absorption étant liées (loi du rayonnement de Kirchhoff). Le physicien Max Planck en 1900 imagina ce qui se produirait dans le cas idéal du corps noir.[5] 6.5.2. Réflexion La réflexion se définit comme un changement de direction du rayonnement électromagnétique quand celui-ci atteint une surface. En télédétection, le phénomène de réflexion est primordial, car l’identification de la nature des objets par les capteurs satellitaires repose en grande partie sur la manière dont ils renvoient le rayonnement. La direction du rayonnement réfléchi peut varier, elle dépend de la rugosité des surfaces naturelles. On distingue ainsi trois types de réflexion : réflexion spéculaire, réflexion diffuse et réflexion de volume. 6.5.3. Absorption Tous les corps naturels absorbent une partie du rayonnement qui leur parvient. La partie du rayonnement absorbé modifie l'énergie interne du corps. Il y a production de chaleur et réémission de l'énergie à une plus grande longueur d'onde. 8 Télédétection et classification En télédétection spatiale, la notion d'absorption est fondamentale car le signal parvenant au capteur satellitaire est modifié au cours de la traversée atmosphérique où le rayonnement est fortement absorbé par les constituants gazeux et les particules en suspension. Il est intéressant de noter que contrairement à ce qui se passe dans l'atmosphère, transparente aux rayonnements visible et proche infrarouge, les surfaces naturelles elles, absorbent une partie de ces rayonnements. 6.5.4. Transmission Lorsqu’une partie du rayonnement incident passe à travers un milieu, on dit que le rayonnement est transmis. Le phénomène de transmission concerne les milieux plus ou moins transparents comme l'eau, les nuages ou l'atmosphère, mais pas uniquement. Le feuillage des arbres par exemple se comporte comme un milieu transparent vis-à-vis du rayonnement proche infrarouge. Cette notion de transmission est très importante en télédétection, puisque les capteurs dédiés à l’observation des surfaces terrestres et océaniques utilisent les bandes spectrales pour lesquelles l’absorption du rayonnement solaire par l’atmosphère est négligeable. Ces bandes spectrales correspondent aux fenêtres atmosphériques discutées dans le chapitre précédent. Figure I. 4: Interactions du rayonnement électromagnétique avec la matière. (Absorption, réflexion, transmission) 9 Télédétection et classification 6.5.5. Réfraction Le phénomène de réfraction correspond à une déviation de la trajectoire du rayonnement lorsqu’il passe d’un milieu à un autre n’ayant pas le même indice de réfraction (rapport entre vitesse de la lumière dans le vide et vitesse de la lumière dans le milieu considéré). La réfraction se produit à l’interface entre les deux milieux. Figure I. 5 : Phénomène de réfraction Selon les lois de Descartes, le rayon réfracté est dans le plan d'incidence et la relation liant les indices de réfraction n 1 et n 2 de chacun des milieux et les angles incident θ1 et réfracté θ2 est la suivante : n1 sin θ1 = n2 sin θ2 . 7. Le spectre électromagnétique Le spectre électromagnétique représente la répartition des ondes électromagnétiques en fonction de leur longueur d'onde, de leur fréquence ou bien encore de leur énergie (figure ci-dessous). Figure I. 6: Le spectre électromagnétique 10 Télédétection et classification Les rayons gamma ( γ ) : Leurs longueurs d’onde s'étendent d’un centième de milliardième (10-14 m) à un milliardième (10-12 m) de millimètre. Les rayons X : Les rayons X ont des longueurs d’onde comprises entre un milliardième (10-12 m) et un cent millième (10-8 m) de millimètre. Les ultraviolets : Leurs longueurs d’onde s’échelonnent d’un cent millième (108 m) à quatre dixièmes de millième (4.10-7 m) de millimètre. Le domaine visible : Il s’étend de quatre dixièmes de millième (4.10-7 m) « lumière bleue » à huit dixièmes de millième (8.10-7 m) de millimètre « lumière rouge ». L’infrarouge : La gamme des infrarouges couvre les longueurs d’onde allant de huit dixièmes de millième de millimètre (8.10-7 m) à un millimètre (10-3 m). En télédétection, on utilise certaines bandes spectrales de l'infrarouge pour mesurer la température des surfaces terrestres et océaniques, ainsi que celle des nuages. Les ondes radar ou hyperfréquences : Le domaine des hyperfréquences s’étend des longueurs d’onde de l’ordre du centimètre jusqu’au mètre. Les ondes radio : Il s'étend des longueurs d'onde de quelques cm à plusieurs km. Contrairement à l'œil humain qui n’est capable de capter le rayonnement que dans une fenêtre très étroite du spectre électromagnétique, celle correspondant au domaine du visible (longueurs d'onde comprises entre 0,4μm et 0,7μm), les capteurs satellitaires utilisent une fraction beaucoup plus étendue du spectre. Domaines spectrales utilisés en télédétection spatiale sont : Le domaine de l’ultraviolet Le domaine du visible Le domaine des infrarouges (proche IR, IR moyen et IR thermique) Le domaine des micros ondes ou hyperfréquences (pas abordé ici, même si elles ont une importance considérable en télédétection RADAR notamment).[7] 11 Télédétection et classification 8. La signature spectrale Le signal capté, réfléchis ou émis par la surface terrestre, les océans ou l'atmosphère, est appelé la signature spectrale. La signature spectrale est considérée comme la carte d’identité radiométrique de l’objet à étudier, chaque objet possède sa propre carte. Traduite dans une image par une position en coordonnées dans un repère de type RGB (Red, Green, Bleu). Figure I. 7: La signature spectrale des surfaces naturelles. 9. Type des Systèmes d’acquisition L’´émergence de nouveaux capteurs d’imagerie satellitaire à haute résolution, dans le cadre du programme d’observation de la Terre requiert plusieurs systèmes d’acquisition partagés en trois groupes selon leurs sources de rayonnement.[4] 9.1. Télédétection passive (visible, infrarouge) On peut l’appeler aussi optique. Le domaine du spectre solaire est le visible et le proche infrarouge, de 0,3 à 4 µm Dans ce type Le soleil est la source, le capteur mesure le rayonnement visible et/ou infrarouge réfléchi par la cible observée. Ce domaine est par excellence celui de la télédétection des espaces terrestres. 9.2. Télédétection passive (infrarouge et micro-onde) Le domaine de L’infrarouge thermique : Au-delà de 3 µm. La cible observée est la source du rayonnement donc le capteur mesure l’’émission thermique de cibles et marine 12 Télédétection et classification et de l’atmosphère. La télédétection infrarouge est surtout destinée à mesurer la température du sol, de l’océan, ou des nuages 9.3. Télédétection actif On peut l’appeler aussi radar. Un capteur radar émet son propre rayonnement électromagnétique et en analysant le signal rétrodiffusé, il permet de localiser et d’identifier les objets, et de calculer leur vitesse de déplacement s’ils sont en mouvement. Et ceci, quel que soit la couverture nuageuse, de jour comme de nuit. Figure I. 8: Utilisation du rayonnement électromagnétique en télédétection 10. Les satellites Le satellite est la plate-forme qui effectue des observations à distance par réception d'ondes électromagnétiques à l'aide des capteurs. C’est un objet qui gravite autour de la terre grâce à la force de la gravité terrien. On peut partager les satellites on plusieurs types selon leurs orbite : 10.1. Satellite géostationnaire Ils sont situés à environ 36000 Km de la terre, ils assurent une observation continue de la même partie de la terre car ils ont une position fixe et ils se déplacent à la même vitesse et dans le même sens que la terre. Leurs domaines d’utilisations sont la météorologie et la climatologie. 13 Télédétection et classification Exemple : METEOSAT, NOAA Figure I. 9: Satellite géostationnaire 10.2. Satellite héliosynchrone Situés approximativement entre 600 et 1000 Km de la terre, ils sont fixe et ne suivent pas le déplacement de la terre, donc ils peuvent observer régulièrement un point particulier à la même heure solaire. Leurs domaines d’application sont la cartographie et la géologie. Exemple : SPOT, LANDSAT. Figure I. 10: Satellite héliosynchrone 14 Télédétection et classification 10.2.1. Caractéristiques du LANDSAT : Notre étude est basée sur une image en provenance du satellite LANDSAT car toutes les images extraites des LANDSAT sont riches en informations géologiques. Le LANDSAT1 (Land Satellite) a été Nommé en premier lieu Earth Ressources Technological Satellite (ERTS) lancé par la NASA en 1972, dans le but de réaliser des prises de vue multicanales de la surfaces terrestre. La série LANDSAT fut divisée en trois générations la première du LANDSAT 1 au 3 dont l’altitude est de 917 Km et un système d’acquisition de 4 canaux et une résolution de 80 m et la deuxième génération de LANDSAT 4 et LANDSAT 5 dont l’altitude est de 705 Km un système d’acquisition de 7 canaux et une résolution de 30 m. La dernière génération avec LANDSAT 6, lancé le 5 Octobre 1993 et écrasé en mer lors du lancement, et LANDSAT 7 lancé avec succès le 15 Avril 1999. Tous deux équipés de nouveaux capteurs : le Thematic Mapper (TM) et l’Enhanced Thematic Mapper Plus (ETM+), il contient 7 canaux : 15 Télédétection et classification Tableau I. 1: Caractéristiques et applications des bandes spectrales du capteur TM. 11. Données optiques Il existe plusieurs techniques et appareils d’acquisition des données optiques tels que les loupes, les microscopes et les satellites. Le satellite produit des images optiques grâce à les instruments (capteurs) optiques HRVIR (Haute Résolution Visible et InfraRouge) qui le compose. Les images optiques allient la haute résolution et le champ large. Ces images satellites optiques ouvrent de nouvelles perspectives pour le développement de services et 16 Télédétection et classification d’applications sur des thématiques aussi variées que la surveillance maritime, l’agriculture, l’environnement et la surveillance des forêts.[4] 12. Image satellitaire Les images satellitaires sont conçues à partir d’informations relevées par des satellites. Le satellite balaye point par point la surface terrestre et attribue une valeur entre 0 et 255 à chaque point de surface en fonction de la quantité d’énergie renvoyée. Ces données chiffrées sont transmise à une station au sol qui compose l’image de la région survolé point par point. Chaque valeur reçue attribue une nuance de gris au pixel dessiné. L’image est défini comme une fonction f (x, y) a deux variables x et y ou x est la ligne et y est la colonne fournissant une ou plusieurs valeurs entières représentant les niveaux de gris du pixel. 12.1. Caractéristique des images satellitaires Les images satellitaires sont caractérisées comme les images simples par plusieurs critères tels que la taille la résolution … 12.1.1. La taille La taille d’une image correspond au nombre de pixels qui compose l’image en hauteur et en largeur. 12.1.2. La résolution Les images se composent de pixels, la taille du pixel détermine la résolution de l’image, et cette taille dépend elle-même de la résolution des capteurs embarqués sur le satellite. Les images de télédétection sont caractérisées par deux types de résolution : 12.1.2.1. La résolution spectrale Est le nombre de pixel par unité de longueur de la structure à numériser. Cette caractéristique est définie lors de la numérisation et dépend du matériel utilisé. Généralement La résolution spectrale est déterminée par la largeur des bandes spectrales utilisées par le capteur ainsi que par le nombre de bandes. Il est évident, qu'un grand 17 Télédétection et classification nombre de bandes spectrales étroites peut nous aider à mieux évaluer la signature spectrale de différents objets. 12.1.2.2. La résolution spatiale Est la plus petite distance entre deux objets adjacents que le capteur peut identifier. Cette distance minimale Entre ces deux objets sera donc fonction du type de capteur utilisé ainsi que de la distance qui le sépare des objets. Figure I. 11: Résolution spatiale des images du Quickbird (Document Digital Globe 2008) 12.1.2.3. La résolution radiométrique La résolution radiométrique exprime la capacité d'un détecteur de mesurer des faibles variations de la quantité du REM. Elle est fonction du système de détection mais aussi du nombre de niveaux de gris utilisés pour créer l'image finale. Ainsi, le même territoire observé sur une image créée avec une échelle de 4 niveaux de gris montre beaucoup moins de nuances qu'une image à 256 niveaux de gris. La plupart des capteurs actuels utilisent des échelles de gris en 8 bits (28= 256). Des capteurs avec un enregistrement de 12 ou 16 bits existent également. 18 Télédétection et classification 4 niveaux de gris 255 niveaux de gris (2 bits) (8 bits) Figure I. 12: Résolution radiométrique des images (Document CCRS/CCT) 12.1.2.4. La résolution temporelle La résolution temporelle exprime le nombre de jours nécessaires pour qu'un satellite puisse observer de nouveau la même région. Par exemple, un système satellitaire avec une résolution temporelle de 18 jours ne peut être utilisé à l'étude d'un phénomène dynamique nécessitant des observations tous les 3 jours, même si les autres caractéristiques de l'imagerie sont adéquates. Notons que le satellite SPOT offre la possibilité de viser un site sur commande permettant ainsi d’assurer une excellente résolution temporelle. Sans manœuvre, la résolution temporelle de SPOT est de 26 jours, 16 jours pour LANDSAT TM et 14.5 jours pour NOAAAVHRR.[3] 13. Prétraitement Ensemble des opérations effectuées sur l’image brut afin d’améliorer son état et faciliter le traitement en renforçant la ressemblance ou accentuant la dissemblance entre les différents pixels de cette image. 13.1. Réduction de bruit Cette opération permet de réduire les perturbations qui affectant la qualité du traitement en réduisant l’amplitude des variations d’intensité dans chaque région. 19 Télédétection et classification 13.2. Rehaussement Consiste à étirer les contraste afin d’augmenter la distinction des tons entre les différents éléments d’une scène. 13.3. Transformation de l’image Sont des opérations similaires à ceux de rehaussement de l’image et combine le traitement des données de plusieurs bandes spectrales. 14. Traitement Les opérations du traitement consistent dans l’extraction des informations et on peut distinguer plusieurs méthodes tel que : 14.1. Segmentation Est l’étiquetage des différents pixels de l’image afin de décomposer cette dernière en plusieurs régions qui ont les mêmes caractéristiques. On peut distinguer trois méthodes de segmentation : Approche région : Consiste à grouper les pixels semblables pour obtenir des régions homogènes Approche frontière : Consiste à rechercher les pixels dissemblables afin de trouver les contours entre les zones hétérogènes. Approche hybride : Cette méthode consiste à mélanger les deux approches précédentes.[6] 14.2. Classification La classification occupe une place importante dans le monde de l’imagerie : il s'agit en effet de parvenir à découper puis à regrouper des informations appartenant a la même classe pour aboutir enfin à réaliser le découpage optimale. On peut distinguer deux grandes méthodes de classification : 14.2.1. Classification supervisée Dans cette méthode de classification l’analyste identifie au début un ensemble homogène de données qui compose les données-test. La sélection de ces données est basée 20 Télédétection et classification sur sa connaissance, Cet échantillon est ensuite utilisé pour l'apprentissage des règles de classement donc la classification est supervisé par l’expert analyste. [8][Net 2 ] Les méthodes les plus utilisées pour ce type de classification sont les SVM et les méthodes bios inspirées tel que les algorithmes génétiques les réseaux de neurones comme le perceptron multicouche utilisé dans notre étude. 14.2.2. Classification non supervisée Cette méthode vise à regrouper un ensemble de données en segment, partition ou bien des répartitions des individus en classes, en optimisant une règle qui vise l’homogénéité et la distinction de ces individus pour les quelle une classe est apriori connue au moins pour un échantillons d’apprentissage. [6] Il existe plusieurs méthodes de classification non supervisé tels que méthode des nuées dynamiques, Le regroupement hiérarchique et L'analyse en composantes principales 15. Conclusion Dans cette première partie nous avons abordé les différentes étapes d’acquisition des images optiques exploitées dans notre étude, les divers définitions des termes scientifique utilisés par la suite et les méthodes de prétraitement et traitement appliqué sur ces image afin de mieux comprendre 21 les chapitres suivants Les réseaux de neurones . Chapitre 2 Les Réseaux de neurones Les réseaux de neurones Les réseaux de neurones 1. Introduction Le cerveau est un système complexe qui effectue un travail énorme au niveau du corps humain, il est responsable de toutes les activités biologiques grâce à de nombreuse cellules appelées neurones. Leur traitement parallèle de l’information a incité les chercheures scientifiques à modéliser un système mathématique neuronal qui permet l’utilisation des mécanismes de ces neurones dans divers domaines, ce système est nommé le réseau de neurone. Un réseau neuronal est un ensemble de neurones artificiels interconnectés par des liens qui simulent les dendrites (à l'entrée d'un neurone) ou l'axone (à la sortie du neurone). Lorsque les entrées d'un neurone satisfont certaines conditions d'activation, le neurone émet une valeur de sortie qui à son tour influencera d'autres neurones, ce système de fonctionnement permet à l'ensemble d'accomplir des actes intelligents. Un réseau se distingue en général par le type de neurone formel utilisé, la règle d’apprentissage qui le décrit et l’architecture définissant les interconnections entre neurones. [9] Les réseaux de neurones ont fait l’objet d’un intérêt en progression continuelle depuis une vingtaine d’années à cause de leur capacité, flexibilité et parcimonie. Ils sont fabriqués de structures cellulaires artificielles pour construire une approche qui permet la résolution des problèmes de perception, de mémoire, d’apprentissage et de raisonnement. 2. Le modèle neurophysiologique L’élément de base du système nerveux central est le neurone. Le cerveau se compose d'environ mille milliards de neurones, avec 1000 à 10000 synapses (connexions) par neurone. Le neurone est une cellule composée d’un corps cellulaire et d’un noyau. [10] Le corps cellulaire se ramifie pour former ce que l’on nomme les dendrites. Celles-ci sont parfois si nombreuses que l’on parle alors de chevelure dendritique ou d’arborisation dendritique. C’est par les dendrites que l’information est acheminée de l’extérieur vers le soma (corps du neurone). L’information est traitée alors par le corps cellulaire. Si le potentiel d’action dépasse un certain seuil, le corps cellulaire répond par un stimulus. Le signal transmis par le neurone chemine ensuite le long de l’axone (unique) pour être transmis aux autres neurones. La transmission entre deux neurones n’est pas directe. 22 Les réseaux de neurones En fait, il existe un espace intercellulaire de quelques dizaines d’Angströms entre l’axone du neurone afférent et les dendrites du neurone efférent. La jonction entre deux neurones est appelée synapse. [2] La figure suivante décrit un neurone avec son arborisation dendritique. Figure II. 1: Neurone biologique avec son arborisation dendritique.[Net 3] 3. Le modèle mathématique Les réseaux de neurones biologiques réalisent facilement un certain nombre d'applications telles que la reconnaissance des formes, le traitement du signal, l'apprentissage par l'exemple, la mémorisation et la généralisation. C'est à partir de l'hypothèse que le comportement intelligent émerge de la structure et du comportement des éléments de base du cerveau, que les réseaux de neurones artificiels se sont développés. La Figure 2 montre la structure d'un neurone artificiel. Chaque neurone artificiel est un processeur élémentaire. Il reçoit un nombre variable d'entrées en provenance de neurones amont. A chacune de ces entrées est associé un poids w, abréviation de weight (poids en anglais), représentatif de la force de la connexion. [10] Chaque processeur élémentaire est doté d'une sortie unique, qui se ramifie ensuite pour alimenter un nombre variable de neurones aval. 23 Les réseaux de neurones Figure II. 2 : Neurone artificiel Il existe un grand nombre de modèles de neurones. Les plus utilisés sont basés sur le modèle développé par McCULLOCH & PITTS. Le neurone peut être représenté par une cellule possédant plusieurs entrées et une sortie, et peut être modélisé par deux phases. (Figure 2.3).[1] x 1 y f a w 11 a x i i i w j ij Figure II. 3: Neurone formel La première phase, appelée activation, représente le calcul de la somme pondérée des entrées selon l'expression suivante : a w x i i ij j [1] Où :Xj représente les valeurs d'entrées Wij représente les poids synaptiques entre le neurone d'entrée Xj et le neurone Xi 24 Les réseaux de neurones A partir de cette valeur, une fonction de transfert calcule la valeur de l'état du neurone. C'est cette valeur qui sera transmise aux neurones aval. Il existe de nombreuses formes possibles pour la fonction de transfert. Les plus courantes sont présentées dans la Figure 2.4. On remarquera qu'à la différence des neurones biologiques dont l'état est binaire, la plupart des fonctions de transfert sont continues, offrant une infinité de valeurs possibles comprises dans l'intervalle [0,+1] ou [-1, +1]. a. fonction à b. fonction linéaire seuil par morceaux c. fonction sigmoïde d. fonction gaussienne tangentielle Figure II. 4: Différents types de fonctions de transfert pour le neurone artificiel. [1] 4. Structures d'interconnexion Les connexions entre les neurones qui composent le réseau décrivent la topologie du modèle. Elle peut être quelconque, mais le plus souvent il est possible de distinguer une certaine régularité. Ils existent plusieurs types de topologie 4.1. Réseau multicouches Les neurones sont arrangés par couche. Il n'y a pas de connexion entre les neurones d'une même couche et les connexions ne se font qu'avec les neurones des couches suivantes. Figure II. 5: Réseau multicouches 25 Les réseaux de neurones Habituellement, chaque neurone d'une couche est connecté à tous les neurones de la couche suivante et celle-ci seulement. Ceci nous permet d'introduire la notion de sens de parcours de l'information au sein d'un réseau et donc définir les concepts de neurone d'entrée, neurone de sortie. Par extension, on appelle couche d'entrée l'ensemble des neurones d'entrée et couche de sortie l'ensemble des neurones de sortie. Les couches intermédiaires n'ayant aucun contact avec l'extérieur sont appelées couches cachées. 4.2. Réseau à connexions locales Il s'agit d'une structure multicouche mais qui conserve une certaine topologie. Chaque neurone entretient des relations avec un nombre réduit et localisé de neurones de la couche suivante (Figure 2.6). Les connexions sont donc moins nombreuses que dans le cas d'un réseau multicouche classique. Figure II. 6: Réseau à connexions locales 4.3. Réseau à connexions récurrentes Les connexions récurrentes ramènent l'information en arrière par rapport au sens de propagation défini dans un réseau multicouche. Ces connexions sont le plus souvent locales (figure 2.7). Figure II. 7: Réseau à connexions récurrentes 26 Les réseaux de neurones 4.4. Réseau à connexion complète C’est la structure d'interconnexion la plus générale (Figure 2.8). Chaque neurone est connecté à tous les neurones du réseau (et à lui-même). [11] Figure II. 8 : Réseau à connexion complète 5. Apprentissage 5.1. Notion d’apprentissage La composition complexe du système neuronal lui permet d’effectuer de nombreuses opérations telle que l’apprentissage grâce à lequel la personne peut reconnaitre son environnement, distinguer entre les langues et les différentes expériences passées à travers les modifications qui s’opèrent entre les connexions des neurones, certaines de ces connexions seront renforcées d’autres seront affaiblies ou bien complètement effacées c’est sur ce principe qui se base l’algorithme d’apprentissage des réseaux de neurones. L’apprentissage dans les réseaux de neurones est défini comme étant un processus dynamique et itératif durant lequel les poids du réseau seront modifiés selon la fonction d’activation et les données entrées afin d’obtenir le comportement désiré. Dans ce cadre, on peut distinguer plusieurs types d’apprentissage les plus connus sont l’apprentissage supervisé et le non supervisé. 5.2. Apprentissage supervisé L’apprentissage supervisé est renforcé par un ensemble de données dites sorties désirées Dn, c’est en fonction de ces données que le réseau doit produire ces propres sorties en calculant à chaque fois l’écart entre les deux sorties dans le but de le minimiser. 27 Les réseaux de neurones W D(n) Réseau de neurone X(n) Y(n) E(n) < Algorithme d’adaptation Figure II. 9: Apprentissage Supervisé 5.3. Apprentissage non supervisée Dans ce type d’apprentissage le réseau n’a aucune connaissance sur les sorties donc il doit s’auto-Organisé afin d’optimiser la fonction définie. [13][1] W Réseau de neurone X(n) Y(n) Algorithme d’adaptation Figure II. 10: Apprentissage non Supervisé 5.4. Les règles d’apprentissage 5.4.1. Loi de Hebb En 1949, Le physiologiste américaine Donald HEBB a présenté une règle qui porte son nom et qui est présente presque dans tous les modèles actuels. Son principe est que Si deux unités connectées sont actives simultanément, le poids de leur connexion est augmenté ou diminué. [12] j wij i ΔWij = R AiAj « R » est une constante positive qui représente la force d'apprentissage (learning rate). 28 Les réseaux de neurones Ai = -1 Ai = 1 Aj = -1 ΔWij = R ΔWij = -R Aj = 1 ΔWij = -R ΔWij = R Tableau II . 1 : La loi de Hebb 5.4.2. La règle de delta : En 1957 l’automaticien américaine Bernard WINDROW et HOFF ont mis en place la règle de delta, qui est définie par une sortie désirée fixé par l’expert humain et une activation produite par le réseau, si la sortie est inférieure à la réponse désirée, il va falloir augmenter le poids de la connexion à condition bien sûr que l'unité `j` soit excitatrice (égale à 1). J wij i ΔWij = R(Di-Ai)Aj Ai = 0 Ai = 1 Di = 0 ΔWij = 0 ΔWij = -R Di = 1 ΔWij = R ΔWij = 0 Tableau II . 2 : la règle de delta 6. Généralisation La généralisation peut être décrite comme la capacité de reconnaitre un nouvel ensemble de données qui n’appartient pas à l’ensemble d’apprentissage, donc le réseau est capable d’approximer une fonction à partir d’une partie des données. Ceci peut être lié à la notion de sur-apprentissage, ces deux caractéristiques sont antagonistes car si le réseau apprend parfaitement les exemples proposés, il sera incapable de généraliser. [9] 7. Le modèle MLP Le perceptron multicouche est le réseau le plus utilisé grâce à la simplicité et la rapidité de son apprentissage. Le principe de son architecture est de regrouper plusieurs neurones dans une même couches et les connectés aux neurones de la couche suivante jusqu'à la dernière couche qui produit les résultats. Les neurones de la première couche reçoivent les 29 Les réseaux de neurones entrées du réseau et chaque couche intermédiaire reçoit les sorties de la couche précédente. Ces couches n’ont aucun contact avec l’extérieur, elles sont dites couches cachées à la fin de cette chaine on trouve la couche de sortie qui reçoit les sorties de la dernière couche caché. La figure suivante représente l’architecture d’un perceptron multicouche avec deux couches cachée. Couche d’entrée Première Deuxième Couche cachée Couche cachée Couche de sortie Couches cachées Figure II. 11: Architecture D’un Perceptron Multicouches avec deux couches cachées. 7.1. Algorithme du MLP 7.1.1. Types d’entrées Les entrées du MLP prennent plusieurs formes elles peuvent être binaires, entières ou réelles. 7.1.2. Fonction d’activation Les fonctions les plus utilisées dans ce type sont les fonctions sigmoïdes et les fonctions à seuils 30 Les réseaux de neurones 7.1.3. Apprentissage Le type d’apprentissage le plus utilisé est l’apprentissage supervisé. 7.1.4. Algorithme d’apprentissage Le MLP utilise pour son apprentissage un algorithme de rétro-propagation du gradient (back-propagation) qui est une généralisation de la règle de WINDROW-HOFF (règle de delta). On peut partager l’algorithme en deux étapes essentielles : 7.1.4.1. Propagation avant Le but principal de cette étape est le calcul de l’erreur global du réseau. Pour chaque neurone de la couche caché calculer la somme pondérée des valeurs de sortie des neurones de la couche d’entrée :Pour i =1….n aj Calculer la valeur de sortie de chaque neurone de la couche cachée en appliquant sa fonction de sortie : Xj=F (aj ) Pour chaque neurone de la couche sortie calculer la somme pondérée des valeurs de sortie des neurones de la couche cachée :Pour j=1....m Calculer la valeur de sortie de chaque neurone de la couche sortie en appliquant sa fonction : Yk=F (ak ) Calculer l’erreur de chaque sortie par : EL= Ydes-Ykou Ydes :la sortie désirée. Calculer la fonction de l’erreur quadratique : Pour tout l’ensemble d’apprentissage N, la fonction d’erreur quadratique moyenne(EQM) :E(n)= 7.1.4.2. Rétro-propagation Son but est de modifier les poids de chaque couche Calculer le signal d’erreur de la couche de sortie :δl=(ydes-yk)F` (ak) 31 Les réseaux de neurones Calculer la modification du poids de la couche sortie : Δwjk= η δlxj Avec η une constante définie par l’expert généralement fixé à 1. Rétro pager les erreurs δl vers la couche cachée précédente. Calculer la contribution de Chaque neurone de la couche cachée dans l’erreur global :δinl= Calculer le signal d’erreur de chaque neurone cachée : δj = δinlF` (aj ). Calculer la modification du poids de la couche cachée : Δwij= η δjx i Modification des poids (Nouveau) wij = Δ wij+ wij(ancien) (Nouveau) wjk = Δwjk+ wjk(ancien) Les deux étapes de l’algorithme serons répétées jusqu’as ce que le critère d’arrêt soit satisfait. Le critère d’arrêt est sois le nombre maximale d’itérations est atteint sois l’erreur est considéré comme négligeable (atteindre le seuil fixé).[14] 7.2. Domaine d’application Le réseau MLP est considéré comme un séparateur non linéaire et peut être utilisé dans divers domaines tel que la reconnaissance des formes (images..), le traitement de signal et de la parole, la classification, le domaine bancaire ou à l’aide a la décision. [Net 4] 8. Conclusion Le point fort du MLP est sa capacité de généralisation, notamment sur les données bruitées mais il y a un risque de convergence vers un optimum local. Les performances du réseau de neurones sont très souvent liées à son architecture. Le nombre des unités cachés dans un MLP ont un impact sur ses performances. On peut trouver des difficultés dans le réglage 32 des paramètres. Chapitre 3 Les systèmes immunitaires Les systèmes immunitaires Les systèmes immunitaires 1. Introduction Chaque organisme possède un système d’auto défense qui lui permet de se protéger des différents pathogènes attaquant ses cellules, ce système est appelé le système immunitaire naturel et a été découvert en 1984 par le docteur Niel JERNE. Il est constitué d’un ensemble d’organes, tissus, cellules et molécules permettant de répondre contre les invasions des organismes étrangères tel que les bactéries et les virus. Les cellules responsable dans le système immunitaire biologique sont les globules blancs formés en moelle osseuse, on distingue différentes classes de ces globules tel que les polynucléaires, les macrophages et les lymphocytes T et B et les cellules NK. Elles se caractérisent par un ensemble de mécanismes qui lui permet de reconnaitre le soi du non soi et de rejeter ce qui lui est étranger.[15] Le système immunitaire artificiel (SIA) ou artificiel immune système (AIS) est classé dans la catégorie des algorithmes inspirée bio. Le principe de fonctionnement de cette méthode est inspiré du système immunitaire naturel des vertèbres afin d’exploiter leurs caractéristiques de mémorisation et d’apprentissage dans le monde de l’intelligence artificiel. Les premiers travaux sur ce système ont commencé dans le milieu des années 80 par FARMER, PACKARD et PERELSON sur les réseaux immunitaires en 1986 et se lance dans les années 90 par FORREST et AL sur la sélection négative en 1994 en même temps que HUNT et COOKE sur des modèles de réseaux immunitaire. Le premier livre sur les systèmes immunitaires artificiels a été publié en 1999 par DASGUSTA. En 2002 les travaux de DE CASTRO &VON ZUBEN et NICOSIA &CUTELLO sur l’algorithme de la sélection clonale « CLONALG » furent remarqués. Plusieurs algorithmes inspirés du système immunitaire ont été explorés même ce de la réponse immunitaire innée et le fait que ces algorithmes apportent de nouvelles succès est le sujet de débats qui animent le développement des systèmes immunitaires artificiels.[16] 33 Les systèmes immunitaires 2. Système immunitaire naturel 2.1. Immunité naturelle L’immunité est la capacité de l’organisme à résister à des attaques étrangères menaçantes pour son bon fonctionnement ou sa survie. On peut citer deux types d’immunité naturelle : 2.1.1. L’immunité innée Est la première ligne de défense présente dès la naissance et évolue par interaction de l’individu avec l’environnement. Appelé aussi immunité non spécifique adapté à un nombre réduit d’antigène, ce type d’immunité est non adaptative mais a un rôle fondamental dans l’initiation des réponses adaptatives. Elle fait l’objet de quatre barrières : 1) anatomique : peau, muqueuse, sécrétions glandulaires…. 2) physiologique : température, PH, sueur, larme… 3) Phagocytaire : macrophages et polynucléaires 4) réaction inflammatoire locale : rougeurs, douleurs, œdème… [17] 2.1.2. L’immunité acquise Appelé aussi immunité spécifique adapté a un nombre infini d’antigènes, elle se développe lorsqu’un antigène apparaisse une deuxième fois ou plus dans le même corps activant ainsi les cellules B mémoire développées pour ce type d’antigène. La réponse dans ce type d’immunité est plus rapide que dans l’immunité innée cela revient à sa capacité de mémorisation, sa spécificité, sa diversité et sa reconnaissance du soi et non soi. Ces caractérisations ont incité les chercheurs à développer un système immunitaire artificiel. 2.2. Définition d’antigène L’antigène est l’entité étrangère et dangereuse qui stimule les cellules à produire un acide spécifique engendrant la réponse immunitaire. Cette entité peut être un virus ou une bactérie. Chaque antigène possède une partie spécifique appelé épitope.[18] 34 Les systèmes immunitaires 2.3. Composant du système immunitaire naturel Le système immunitaire est constitué des trois composantes suivantes : les cellules, les substances peptidiques libres et les organes. 2.3.1. Les cellules Les cellules du système immunitaire sont toutes des leucocytes et sont répartie en trois catégories montrées dans la figure suivantes : Leucocytes Immunité innée Granulocy tes Immunité acquise Lymphocyt es Monocytes/macrophage s Cellules T Cellules B Plasma Cellules mémoires Figure III. 1: Les cellules du système immunitaire naturel Les granulocytes : Ce sont les cellules les plus nombreuses dans le sang ils détruisent toutes les cellules porteuses d’antigènes. Figure III. 2: Cellule granulocyte Les monocytes et les macrophages : Les monocytes se trouvent dans le sang avec un faible pourcentage et subissent différentes modifications pour devenir des macrophages qui détruisent les bactéries se trouvant dans les lieux des infections et les globules rouges en fin de vie. 35 Les systèmes immunitaires Figure III. 3: Cellule monocyte Figure III. 4: Cellule macrophage Les lymphocytes : Représentent 20 à 40 % des leucocytes, ces cellules sont spécifiques ils ne peuvent reconnaître qu’un seul antigène. On distingue deux types de lymphocytes T et B. Lymphocytes B : Ces cellules produisent les récepteurs d’antigène appelé anticorps ces derniers se terminent dans les deux extrémités par un paratope qui permet de se lié à l’épitoge de l’antigène. Figure III. 5: Cellule lymphocyte B Lymphocytes T : Représentent environ 70% de tous les lymphocytes. Il existe deux types : Figure III. 6: Cellule lymphocyte T 36 Les systèmes immunitaires - Les lymphocytes T cytotoxiques attaquent et détruisent les cellules étrangères directement sans la production d’anticorps. - Les lymphocytes T auxiliaire régularisent l’activité des autres cellules du système immunitaire naturel.[Net 5] Anticorps : C’est des protéines complexes formés de 4 chaînes polypeptidiques deux chaînes lourdes (H pour heavy) et deux chaînes légères (L pour light) reliées entre elles par des ponts assurant une flexibilité de la molécule. Ces chaînes forment une structure en Y. Chaque chaîne légère est constituée d’une partie constante et d’une partie variante et chaque chaîne lourde d’une partie variante et de 3 ou 4 fragments constants. Les anticorps ont trois fonctions principales : se lier à l’antigène, activer le système du complément et recruter des cellules immunocompétentes.[19] Figure III. 7 : Structure D’un Anticorps 37 Les systèmes immunitaires 2.3.2. Substances solubles Les trois types de protéines qui composent le système immunitaire sont : L’immune globine :Il existe un nombre infini d’immunes globines exerçant des fonctions d’anticorps. Cette diversité est une caractéristique du système immunitaire naturel. Les cytokines : Leurs rôle est de régularisé la réponse immunitaire par l’amplification, par le croissement ou par la suppression. Le système du complément : Qui contient environ vingt protéines qui agissent d’une manière non spécifique. Ils se lient au complexe antigène-anticorps pour faciliter l’ingestion de particules par certains types de leucocytes appelés phagocytes(monocytes, macrophages, polynucléaires..). 2.3.3. Les organes Sont les organes qui forme et hébergent les lymphocytes tel que la moelle osseuse et le thymus, la rate, les ganglions lymphatiques et différentes structures annexées aux muqueuses.[Net 6] 2.4. Fonctionnement La réponse immunitaire est déclenchée au sein d’un organisme vital après la détection d’un antigène. Elle est composée des étapes qui suivent : 2.4.1. Réaction inflammatoire La première barrière de défense contre les intrus, son but est de désactiver les agresseurs sans connaitre leur nature cette réponse est donc non spécifique.[20] 2.4.2. Réponse immunitaire On peut distinguer deux types de réponse immunitaire qui se différent dans les cinq points suivants :[15] 38 Les systèmes immunitaires La cause Réponse primaire Réponse secondaire Introduction de l’antigène pour la Introduction du même antigène première fois dans l’organisme. dans l’organisme une nouvelle fois. Long (quelque jour) interaction Court car les cellules mémoires Temps de latence cellulaire entre les lymphocytes et spécifiques se transforment en les macrophages (leur surface). plasmocytes et génèrent les anticorps. La production des anticorps en Plus long à cause de la production fonction des divisions et les en double des anticorps à partir des Phase de synthèse différentiations des lymphocytes cellules mémoires et les nouveaux lymphocytes activés. d’une réponse primaire. Phase de déclin La phase d’épuisement longue car le nombre d’anticorps est plus important. stimulus antigénique. Phase de repos du Plus L’antigène n’est plus détecté. Prend plus de temps. Tableau III. 1 : Comparaison entre la réponse primaire et secondaire 2.5. Les maladies du système immunitaire Les maladies du système immunitaire résultent d’un dysfonctionnement du système immunitaire qui s’attaque aux constituants normaux de l’organisme. C’est le cas par exemple de la sclérose en plaques, du diabète de type 1. Normalement, le système immunitaire défend l’organisme vis-à-vis d’agressions extérieures et tolère ses propres constituants. Les maladies auto-immunes surviennent quand cette tolérance se rompt. Le système immunitaire devient alors pathogène et induit des lésions tissulaires ou cellulaires. Ces maladies évoluent de façon chronique tout au long de la vie, avec des phases de poussées et de rémissions. 39 Les systèmes immunitaires 3. Le système immunitaire artificiel 3.1. Les notions de bases du système immunitaire artificiel 3.1.1. La représentation des données La représentation des données joue un rôle majeur dans le déroulement de l’algorithme et influe directement sur les résultats obtenus. On peut distinguer plusieurs types de codages des individus mais les plus utilisées sont : Le codage binaire : Ce type de codage est le plus utilisée en intelligence artificielle, il consiste à créer une chaine de bits binaires de taille fixe de longueur n. 1 0 0 0 1 1 1 1 0 1 0 1 0 0 0 1 1 0 n bits Figure III. 8: Représentation des données binaire Le codage réel (à caractère multiples) : Ce type de codage est le plus utilisé dans les systèmes immunitaires artificiels, il consiste à représenter chaque individu dans un espace de dimension n (Rn). 1 2 X X 3 4 X X … … X n-2 n-1 X X n Figure III. 9: Représentation des données réelles Le codage par structure arborescente (fonctionnelle) : Ce type de codage est rarement utilisé dans le domaine d’intelligence artificielle, il consiste à créer un arbre qui doit être parcouru de gauche à droite en commençant par la première feuille de gauche jusqu'à la dernière feuille de droite en passant par tous les nœuds et les feuilles de l’arbre. [Net 7] 40 Les systèmes immunitaires + * a b c d Figure III. 10: Représentation des données sous forme arborescence [Net 7] 3.1.2. L’affinité L’affinité est le degré de ressemblance entre un antigène et un anticorps elle se mesure par la distance (euclidienne, hamming…..), deux individus ont une affinité élevée si la distance entre eux est la plus petite par rapport aux autres. 3.1.3. Le clonage Le clonage est la duplication des organes pour avoir des êtres génétiquement identique. Le but de cette opération est de garder les informations plus longtemps dans l’espace de travail. 3.1.4. La Mutation La mutation est définie comme une modification irréversible de l’information génétique. La mutation est une opération de Ω vers Ω qui produit un nouvel individu x’ proche de x. Mutation : Ω Ω X X’ Cette opération permet une recherche aléatoire dans l’espace afin de pouvoir détecter des optima qui ne sont pas encore visités. 41 Les systèmes immunitaires La mutation varie selon la représentation des données, dans ce sens, on trouve différents types de mutation dans le cas de présentation binaire, de même pour la mutation gaussienne dans le cas des représentations réelles. [15][18] 3.2. Les algorithmes du système immunitaire artificiel 3.2.1. La sélection négative La sélection négative est utilisée pour la détection du soi et le non-soi, elle a été proposée pour des problèmes de détection d’anomalies et d’intrusion, son principe est de partir d’un ensemble de détecteurs et de détecter des changements dans cet ensemble de soi s’ils existent. 3.2.1.1. L’algorithme de la sélection négative : L’algorithme de sélection négative est basé sur la génération d’un ensemble de détecteurs qui sera chargé de détecter les éléments du non-soi. L'algorithme de sélection négative fonctionne comme suit: 1- Nous avons un ensemble de données S représentant le soi. 2- un ensemble de détecteurs RD est généré aléatoirement dans l’espace de travail. 3- L’affinité de tous Les éléments de l’ensemble RD avec les éléments de l’ensemble S sera déterminé, si un élément de S est reconnu par un élément de RD c'est-à-dire le plus proche alors l’élément de RD sera rejeté, sinon il sera ajouté à l’ensemble RD. 4- Si une chaîne de S change de forme (mutation), elle à de grandes chances qu’elle soit reconnue par un des détecteurs de RD.[21] 5- Pour certains ensembles de chaines, des trous peuvent apparaitre qui ne peuvent être couverts par n’importe laquelle des configurations possibles de détecteurs, sans que cela conduise à recouvrir des chaines du soi 42 Les systèmes immunitaires 1. Chaines du soi S 2. Chaines S et des détecteurs RD 5. Trou dans les chaines du soi 3. Tolérisation 4. Détection de changement Figure III. 11: L’algorithme de la sélection négative 43 Les systèmes immunitaires La figure montre les démarches générales de la fonction d’une sélection négative Function Negative Selection (S, r, n) Entrées : S ensemble de valeur qui définissent le soi R le seuil d’activation N ensemble de détecteur requis Begin j←0 While j<= n do M←rand (1, L) // Initialisation For every s of S do // Affinity evaluation Aff ← affinity (m, s, r) If aff <= r then // Generation of the available répertoire A← insert (A, m) End If end for j←j+1 End While Return A End Figure III. 12: Pseudo-code de l’algorithme de la sélection négative. [22] 44 Les systèmes immunitaires Domaines d’utilisations de la sélection négative 3.2.1.2. La sélection négative a été appliquée par ESPONDA et FORREST aux problèmes de détection d’intrusions dans un réseau informatique. Le système LISYS, génère un ensemble de détecteurs qui ne doivent détecter aucun paquet transmis sur un réseau sain mais qui s’activent dès qu’ils rencontrent un suspect dans le réseau. En 2003 ESPONDA et AL ont appliqué la sélection négative aux bases de données négatives qui stockent des données dans leur forme négative de façon à ce que la récupération des données sous leur forme d’origine est un problème difficile. Ces bases étant très utiles dans la sécurité informatique pour leur rôle de stockage des mots de passes. 3.2.2. La sélection clonale La sélection clonale est complémentaire à la sélection négative, elle est utilisée après la reconnaissance du non soi (antigène) dans une chaine s par une cellule B. L’algorithme proposé par certaines auteurs « CLONALG » a été inspiré des principes biologique de la sélection clonale, il a été utilisé initialement pour la reconnaissance des formes puis pour l’optimisation. L’algorithme de CLONCLASS 3.2.2.1. Les étapes fondamentales de CLONALG sont les suivantes : Initialisation Générer aléatoirement un ensemble S de solution « anticorps ». La population S est divisée en 2 composants, des anticorps à "mémoire" m qui représentent la solution et un ensemble r utilisé pour introduire de la diversité. Répéter tant qu’une condition prédéfinie n’est pas vérifiée Evaluation et sélection 1 Calculer l’affinité entre tous les éléments de S avec l’ensemble des antigènes et sélectionner les anticorps qui ont la plus grande affinité. 45 Les systèmes immunitaires Clonage Cloner chaque anticorps sélectionné proportionnellement à son affinité, mettre les clones dans un ensemble C. Mutation Chaque clone de C subisse une mutation avec un degré inversement proportionnel à son affinité, Plus l’affinité est grande plus le taux de mutation est faible. Pour obtenir une population mature C* qui répond mieux aux antigènes. Evaluation et sélection 2 Sélectionner S2 anticorps de C* qui ont les plus grandes affinités pour obtenir un nouveau ensemble d’anticorps mémoire. Diversité Combiner S2 avec l’ensemble m, les anticorps générés aléatoirement et remplacer ceux qui ont la plus faible affinité pour obtenir l’ensemble des anticorps mémoire m . Mort Les anticorps non retenus dans m seront éliminés. 46 Les systèmes immunitaires Une fonction générale de la sélection clonale est comme suit: Figure 3.13. : L’algorithme de la sélection clonale[21] 1. Initialisation de la population d’anticorps 2. Cellules B activées 3. Cellules B clonées 4. Maturation des cellules B 5. Nouvelle population d’anticorps 6. Diversification de la population d’anticorps Figure III. 13: L’algorithme de la sélection clonale 47 Les systèmes immunitaires Figure III. 14: Pseudo-code de l’algorithme de la sélection clonale. 48 Les systèmes immunitaires Notez que cet algorithme permet au système immunitaire artificiel de devenir plus performent à sa tâche de reconnaissance des schémas (antigènes). Ainsi, en fonction d'un comportement évolutionnaire, CLONALG apprend à reconnaître les modes. [22] Domaines d’applications de la sélection clonale 3.2.2.2. Cet algorithme a été utilisé par plusieurs auteurs tels que De Castro et Von Zuben qui l’ont appliqué à l’optimisation ensuite il a été appliqué à la détection d’intrusions puis l’algorithme DynamiCS, qui est traite une classification binaire avec deux classes le soi et le non-soi et utilise la sélection clonale afin de généré les cellules mémoires qui reconnaissent le non –soi sans reconnaitre le soi. L’algorithme ClonAlg a été proposé pour la reconnaissance des formes mais sans aboutir à un bon résultat. Donc White et Garrett l’ont amélioré en implémentant l’algorithme de ClonClas. 3.2.3. Les réseaux immunitaires Le principe de fonctionnement du réseau immunitaire est inspiré de la manière dont les cellules du système immunitaire interagissent entre elles, cette théorie est l’objet d’un nombre considérable de simulations dus aux réfutations de quelque immunologiste et elle fut la base de plusieurs algorithmes tel que le réseau AINET qui est défini comme étant une combinaison entre la sélection clonale et cette théorie. 3.2.3.1. Algorithme AINET Les différentes étapes de l’algorithme AINET sont : Initialisation : Un ensemble d’anticorps N générée aléatoirement ; La population M de cellules mémoire est initialement vide ; Un ensemble d’antigènes G qui présente les données d’apprentissage. 49 Les systèmes immunitaires Pour chaque antigène, faire : Répéter pour un certain nombre d’itérations : Evaluation et sélection 1 Calculer l’affinité de chaque antigène avec tous les anticorps Sélectionner un ensemble n d’anticorps qui ont les plus grandes affinités. À partir de l’ensemble N. Clonage Cloner les anticorps proportionnellement à leurs affinités. Mutation Muter les anticorps clonés selon leur degré d’affinité, plus le taux d’affinités est grand plus le taux de mutation est petit afin de créer un ensemble C* de population mature. Evaluation et sélection 2 Evaluer l’affinité de chaque antigène avec tous les anticorps de l’ensemble C* Sélectionner les anticorps qui ont les meilleures affinités pour obtenir l’ensemble M des cellules mémoire. Suppression clonale 1 Eliminer les cellules mémoire qui sont très similaires les unes aux autres. Mémorisation Ajouter les cellules mémoire qui ont une affinité qui dépasse un certain seuil à la population de cellules mémoire. Mort Eliminer Les anticorps et les cellules mémoire non mémorisés sélectionné. Suppression clonale 2 Eliminer les cellules mémoire (de la population de cellules mémoire) très similaires les unes aux autres. 50 Les systèmes immunitaires En comparant les deux algorithmes la sélection clonale et le réseau immunitaire nous remarquant trop de similarité on peut dire même que la sélection clonale immunitaire est un cas particulier des réseaux immunitaires. Seule l’étape de la suppression clonale qui permet l’interaction entre les anticorps (les cellules mémoire) dans le réseau différencie les deux algorithmes. [23] Domaines d’application 3.2.3.2. Le domaine d’application des algorithmes de l’AIS est trop large en partant de l’apprentissage jusqu’à la robotique en passant par une variété de domaine tel que la sécurité informatique et la détection d’anomalies. Chaque algorithme de l’AIS joue un rôle spécifique c’est la raison pour la quel on trouve La sélection négative dans les bases de données« négative » qui permettent un mode de stockage spécial qui facilite la récupération des données. En plus on la trouve dans le domaine de la détection d’intrusions avec la sélection clonale qui améliore la reconnaissance du non soi (intrusion, virus…) par l’apprentissage. [18][23] La sélection clonale est utilisée aussi pour régler les problèmes d’optimisation, d’apprentissage et de classification. [18] Par ailleurs, les réseaux immunitaires ont été appliqués à l’analyse des activités d’un serveur web et pour produire un système de reconnaissance et de classification de formes. [16] [18] 4. Conclusion Les systèmes immunitaires artificiels ont fait l’objet de plusieurs recherches, grâce aux multiples caractéristiques ils ont été utilisés dans divers domaine. Ils se divisent en trois familles, la premier famille de la sélection négative traite la détection de changement et les problèmes de surveillance grâce à la technique de la reconnaissance du soi et le non soi, la deuxième famille est la sélection négative qui résous les problèmes d’optimisation et détecte les nouveautés dans des données de série chronologique grâce à la mémorisation et enfin la famille des réseaux immunitaires ayant pour but de regrouper des données et de filtrer les données redondantes. 51 Chapitre 4 Conception et Implémentations Conception et implémentations Conception et Implémentations 1. Introduction Dans ce chapitre, on aborde le module expérimentations et résultats, après avoir détailler le coté théorique des méthodologies utilisées dans les chapitres précédents. Notre travail consiste à classer les différents pixels d’une image satellitaire en utilisant un réseau de neurone (perceptron multi couche) optimisé par un système immunitaire artificiel. La première étape consiste à choisir les poids optimaux pour le réseau, par l’algorithme de la sélection clonale du système immunitaire artificiel qui seront ensuite utilisées comme poids initiaux pour le réseau MLP. La deuxième étape est la classification des différents pixels de l’image dans leurs classes appropriées. 2. Ressource et matériels utilisées Pour la mise en œuvre de notre application, on a utilisé un micro-ordinateur ayant les caractéristiques suivantes : Un processeur Intel Core 2 duo 2.10 GHz (T 6570). Une mémoire vive de 2 GO. Un disque dur de 140 GO. Notre application a été développée sous un système d’exploitation Windows Vista 32 bits, ainsi qu’un langage de programmation « C++ BUILDER 6 » connu par les informaticiens par sa flexibilité et sa souplesse. 3. Données expérimentale La donnée optique utilisée dans notre application est l’image satellitaire prise par le satellite LANDSAT5 en 1993, de la région ouest d’Oran, par le centre nationale des techniques spatiales d’Arzew (CNTS). Elle a été choisie pour sa diversité, car on peut distinguer plusieurs classes tel que : mer, sable, ressac…… 52 Conception et implémentations Figure IV. 1: Image d’Oran ouest prise par LANDSAT5 4. Approche hybride proposé 4.1. Introduction Plusieurs travaux de recherche ont été réalisés dans le but d’améliorer les algorithmes des réseaux de neurones, par les algorithmes d’optimisation, telles que les algorithmes génétiques et les systèmes immunitaires artificiels. Le principe de l’approche proposée est de garder l’architecture du réseau MLP, ces fonctions de calcule d’erreur, puis introduire les algorithmes de l’AIS dans l’apprentissage. Dans ce cadre, on a utilisé en premier lieu l’algorithme de CLONALG, puis l’algorithme de CLONCLASS dans l’apprentissage du réseau. En clair notre travail consiste à remplacer la rétro-propagation par l’un des algorithmes cités ci-dessus. 4.2. Population Les populations initiales de notre algorithme sont constituées d’un nombre d’individus, ou chaque individu représente un poids du réseau, et chaque population représente une configuration complète du réseau. Les populations sont stockées sous forme de matrice, chaque ligne détermine l’ensemble des poids de notre réseau, alors que chaque colonne est le numéro de l’individu de cette population. Au début de l’algorithme les populations sont définies aléatoirement, par la suite elles seront modifiées par les opérations de clonage et de mutation. 4.3. Mesure d’affinité La formule qui permet d’obtenir l’affinité est la suivante : 53 Conception et implémentations Affinité = 1-D (1) Où D: représente la distance La distance utilisée dans notre application est définie par l’erreur quadratique moyenne du réseau (EQM) : (2) E(n) = 4.4. Le clonage Selon leur affinité, un nombre de clones seront créés à partir de la population initiale. La formule qui permet de générer le nombre de clones est : C = Round [(N-1)*m] (3) Round ( ) : arrondi la valeur reçue à un entier. Où N est donné par la formule : N = (4) affinité : est l’affinité entre l’anticorps et l’antigène en cours. M : est la longueur du vecteur caractéristique de l’anticorps ou l’antigène. Cette formule de CLONALG a été améliorée dans l’algorithme dans CLONCLASS comme suit : ] (5) Où β : représente un coefficient définie par l’utilisateur (indique le nombre de clones souhaités). Et aff i : est l’affinité entre l’anticorps et l’antigène en cours. 4.5. Mutation La population générée par le clonage subira la mutation. Le nombre de valeur à muter pour chaque anticorps est donné par la formule suivante : T = round [ (1-n)*L] 54 (6) Conception et implémentations Où L : représente la longueur d’un anticorps 4.5.1. Mutation binaire Pour ce type de mutation tous les individus seront converti en binaire, ensuite les différents bits des individus seront permuté avec d’autres bits à condition que le bit concerné par la mutation actuelle n’a pas déjà subi de mutation dans cette itération. 4.5.2. Mutation Réelle Pour ce type, la mutation se fait entre individus de la même population, à condition que les individus concerné par la mutation n’ont pas déjà subit cette opération au cours de cette itération. La mutation est une opération très importante dans notre approche, c’est la raison pour laquelle on a changé sa formule plusieurs fois, pour aboutir à la meilleure formule qui donne le meilleur résultat. 4.6. Evaluation de la nouvelle population Cette évaluation nous permet de reconstitués les populations initiales pour l’itération suivante. Pour cela, On évalue la nouvelle population générée du clonage et la mutation afin de sélectionner les nouveaux éléments. 4.7. Les opérations du MLP : Dans l’approche proposée, nous aurons besoins des opérations MLP deux fois, la première avant le calcul de l’affinité, car on doit calculer l’erreur quadratique moyenne du réseau, afin d’obtenir ensuite l’affinité par la formule (1). La seconde, dans l’opération d’évaluation de la nouvelle population générée par le clonage et la mutation. 55 Conception et implémentations Les opérations de l’algorithme MLP utilisés sont les suivantes : 1- Pour chaque neurone de la couche cachée calculer: Pour j= 1….n aj 2- Calculer la valeur de sortie de chaque neurone de la couche cachée : Xj = F (aj ) Où f est la fonction sigmoïde 3- Pour chaque neurone de la couche sortie calculer: Pour k = 1....m 4- Calculer la valeur de sortie de chaque neurone de la couche sortie: Yk = F (ak ) 5- Calculer l’erreur de chaque sortie par : EL= Ydes-Yk Où Ydes : la sortie désirée. 6- Calculer la fonction de l’erreur quadratique : 7- Pour tout l’ensemble d’apprentissage N, la fonction d’erreur quadratique moyenne (EQM) : E(n) = 5. Déroulement de l’algorithme En premier lieu on utilise l’approche hybride MLP-AIS afin d’obtenir les meilleurs poids pour le réseau, ensuite on utilise ses poids comme poids initiaux pour l’algorithme de rétro-propagation du gradient MLP. 56 Conception et implémentations 6. Schéma de l’application Image multi canal Coloration de l’image Amélioration de l’image Echantillonnage Apprentissage par l’AIS Non Critère d’arrêt atteint Oui Apprentissage par MLP Non Critère d’arrêt atteint Oui Erreur d’apprentissage Classification Image classifiée Figure IV. 2: Organigramme de l’application 57 Conception et implémentations 6.1. Chargement des images brutes La première étape consiste à charger les trois images brutes d’extensions IMG des canaux TM1, TM3 et TM4. 6.2. Coloration de l’image Consiste à colorer les trois images des trois canaux (R, G, B) et de les superposer. 6.3. Amélioration de l’image Cette étape consiste à améliorer l’image obtenue de la coloration afin de faciliter l’échantillonnage. 6.4. Échantillonnage Le choix des échantillons est très important car il influe sur le résultat de la classification. 6.5. L’apprentissage par l’AIS L’apprentissage est constitué de toutes les étapes de l’algorithme de l’AIS en commençant par le clonage, la mutation et l’évaluation de la nouvelle population jusqu’as ce que le critère d’arrêt soit satisfait. Dans ce bloc nous utilisons l’approche hybride proposée afin d’obtenir les meilleurs poids. 6.6. L’apprentissage par MLP Cette étape consiste à poursuivre l’apprentissage par l’algorithme de la rétropropagation du gradient dans le but de minimiser l’erreur globale, et de faire une mise à jour des poids jusqu’à ce que le nombre d’itérations ou le seuil de l’erreur soit atteint. 6.7. La classification Consiste a classé Chaque pixel de l’image dans sa classe approprié. 7. Application et Résultats Au départ nous n’avions aucune connaissance sur les limites de notre approche, et nous n’avions aucune idée sur les résultats qu’on pourrait obtenir, mais on savait que le choix des paramètres jouerait un rôle important dans l’implémentation. La raison pour laquelle on a entamé une série de tests qui nous permettront de choisir les paramètres finaux donnant de meilleurs résultats. 58 Conception et implémentations Note : Nombre des itérations de l’algorithme AIS : Nbr Ite AIS Nombre des itérations de l’algorithme MLP : Nbr Ite MLP Nombre de neurone de la couche cachée : Nbr Neur C C Nombre des populations a cloné : C Nombre de population remplacé : C* Taille de la population : P Erreur quadratique moyenne : EQM Temps d’exécution : T.Exe Nombre de classes trouvées : Nbr .C .T Mutation en mode réel : MLP-AIS Mutation en mode binaire : MLP-AISb Pour la première série de test, au lieu de calculer le nombre de mutant par la formule de l’algorithme CLONALG ou CLONCLASS, on a devisé le pourcentage de mutation en intervalles comme suit : Si 0,50 ≤ affinité<1,00 taux de mutation est de 3 % Si affinité <0,50 : taux de mutation est de 10.00 % Si -0.50 ≤ affinité <0,00 taux de mutation est de 15 % Sinon alors le taux de mutation est de 20.0 % Afin de déterminer les taux précédents nous avons effectuées plusieurs tests. Le nombre des échantillons est fixé à 453 pixels distribués comme suit : Figure IV. 3 : Image d’Oran ouest échantillonné 1 59 Conception et implémentations Tableau IV. 1: Tableau Des Echantillons N°1 Dans cet essai on a implémenté l’approche hybride comme suit : 1- Initialement on a P populations constitué d’antigènes qui représente l’ensemble de poids de tout le réseau. 2- Un nombre de populations qui ont les plus grandes affinités (erreur quadratique moyenne minimale) seront clonées pour construire l’ensemble C. 3- Dans cette étape de mutation, on a deux cas : A-MLP-AIS : Les antigènes (poids) de l’ensemble C subiront une mutation entre les individus de la même population et constitueront un ensemble de populations C* selon leur taux de mutation. B-MLP-AISb : Tous Les antigènes de la population C subiront une transformation en binaire et puis une mutation entre les différents bits selon le taux de mutation afin de composé l’ensemble de populations C*. 4- Le nouveau ensemble de population obtenue C* sera évaluer c’est-à-dire on calculera l’affinité de tous l’ensemble des populations C* et on compare les affinités de toutes les populations (l’ensemble C* et l’ensemble P ) pour supprimer ceux qui ont les plus petites affinités. Pour finir une nouvelle population P* sera construite a partir de P et de C*. Cette population deviendra la population initiale pour l’itération suivante et on retourne à l’étape 2. 7.1. Influence des paramètres Dans le but de déterminer les paramètres les plus influant, nous avons lancés la série de test suivante 60 Conception et implémentations 7.1.1. Influence des paramètres AIS Pour ce premier essai, on a essayé d’éliminer totalement l’algorithme MLP en le remplaçant par l’hybridation MLP-AIS, les autres paramètres ont été fixé comme suit : A B P 100 100 C 4 24 C* 2 16 Nbr Neur C. C 12 12 Nbr Ite AIS 500 500 Nbr Ite MLP 00 00 Tableau IV. 2: Les paramètres fixés pour le premier essai Pour les deux cas les résultats obtenus sont illustré dans le tableau suivant : A B EQM 1.04615 1.04615 T.exe 12.14.06 14.01.00 1 1 Nbr C.T Tableau IV. 3: Les résultats obtenus pour le premier essai 7.1.2. Influence des paramètres MLP Dans ce deuxième essai on a appliqué seulement l’algorithme de la rétro propagation du MLP composé des étapes suivantes 1- Initialement les poids du réseau sont généré aléatoirement dans un intervalle de 2- La fonction Y de la couche cachée de chaque neurone est calculé. 3- Ensuite le calcul de la fonction de sortie de chaque neurone pour obtenir l’erreur quadratique moyenne. 61 Conception et implémentations 4- En fonction de l’EQM le signal est rétro propager en avant pour modifié les poids en suivant les fonctions expliqué dans l’algorithme de la rétro propagation du deuxième chapitre. A B P 100 100 C 6 6 C* 4 4 Nbr Neur C. C 8 12 Nbr Ite AIS 00 00 Nbr Ite MLP 500 500 Tableau IV. 4: Les paramètres fixés pour le deuxième essai Pour les deux cas on a obtenu les résultats suivant : A B EQM 0.18744 0.20571 T.exe 2.07.03 2.11.6 Nbr C.T 3 2 Tableau IV. 5: Les résultats obtenus par le deuxième essai On a refait le même test avec 1000 itérations, les résultats obtenus sont les suivants : A B EQM 0.18040 0.20946 T.exe 4.10.04 4.20.09 Nbr C.T 3 2 Tableau IV. 6: les résultats obtenus par le troisième essai On a effectué les trois premiers essais, dans le but de choisir les paramètres adéquats pour notre application. On a commencé par fixer le nombre d’itérations et le nombre de populations, ensuite on a joué sur les autres paramètres pour pouvoir détecter le paramètre le plus influant. Les essais précédents nous ont permis de choisir le nombre de neurones de la couche cachée et le nombre d’antigènes à cloner et à muter pour avoir des résultats optimaux. 62 Conception et implémentations 7.2. Hybridation MLP-AIS 7.2.1.1. Test 1 Pour les trois cas le nombre des échantillons a été fixé a 453, pour les deux cas (A) et (B) le type de mutation utilisé est la mutation réelle mais pour le troisième cas (C) la mutation a été effectuée en binaire. Les paramètres sont fixés pour ce test comme suit: Cas « A » Cas « B » Cas « C » P 100 100 100 C 8 24 24 C* 6 16 16 Nbr Neur C. C 8 8 8 Nbr Ite AIS 1000 1000 1000 Nbr Ite MLP 1000 2000 4000 Tableau IV. 7: Les paramètres fixés pour le test 1 On a obtenu les résultats suivants : Cas (A) Figure IV. 4 : Image classifié du cas (A) test 1 MLP-AISb , EQM = 0.21853 ; TC = 24,52 Figure IV. 5 : Image classifié du cas(A) test 1 MLP- AIS , EQM = 0.20726; TC =19,23 63 Conception et implémentations Les résultats illustrés dans les deux figures montrent l’apparition de plusieurs mais le taux de classification a atteint 24.12 seulement avec trois bons classements seulement mer, maquis et ressac mais beaucoup de confusion entre les autres classes. Donc on augmenter le nombre d’itérations : Cas (B) Figure IV. 6: Image classifié du cas (B)test 1 MLP- AISb , EQM = 0,19408 ; TC= 14,89 On a obtenu une amélioration dans la valeur de l’EQM mais les mêmes résultats de classements c’est à dire les classes mer et maquis bien classé et la classe ressac a été confuse avec la classe sebkha 1 et la classe mer mais la pluparts de ces pixels ont été reconnus. On a pensé que la solution sera l’augmentation du nombre d’itérations donc on a passé au test suivant : 64 Conception et implémentations Cas ( C) Figure IV. 7 : Image classifié du cas (C)test 1 MLP- AIS, EQM= 0,21486 ; TC=16,58 Malgré l’augmentation du nombre d’itérations, on a pas obtenu de meilleur résultat et les confusions entre les différentes classes n’ont pas changer, donc on a essayé de changer la base d’échantillonnage pour les tests suivants. 7.2.1.2. Test 2 Pour le test 2 l’échantillonnage a été changé et les paramètres sont fixés comme suit : A B C P 100 100 100 C 8 8 8 C* 6 6 6 Nbr Neur C. C 8 8 8 Nbr Ite AIS 1000 100 1000 Nbr Ite MLP 1000 100000 100000 Tableau IV. 8: Les paramètres fixés pour le deuxième test 65 Conception et implémentations CAS (A) Figure IV. 8: Image classifié du cas (A) test 2 MLP- AIS, EQM= 0,23358 ; TC = 20,23 Figure IV. 9: Image classifié du cas (A) test 2 MLP- AISb , EQM = 0,27374; TC = 22,47 Les résultats illustrés dans les deux figures montrent une grande différence entre les deux méthodes et l’intervalle de l’EQM entre les deux méthodes est considérable mais cela n’a pas permis a trouvé toutes les classes. Pour ce test les trois bons classements sont les classes mer, ressac et sebkha2 mais beaucoup de confusion entre les autres classes. CAS (B) Figure IV. 10: Image classifié du cas (B)test 2 MLP- AIS, EQM = 0,29335; TC = 12,66 Ces résultats montrent l’apparition de plusieurs nouvelles classes qui ne sont pas bien reconnus, ne donnant pas une amélioration dans la classification. CAS (C) 66 Conception et implémentations Figure IV. 11: Image classifiée(C)test 2 MLP- AIS, EQM =0.093; TC = 29,48 Les résultats illustrés dans la figure sont meilleur par rapport aux résultats obtenus des tests précédents car L’erreur quadratique moyenne a beaucoup diminuer et trois nouvelles classes ont été trouvées. Après tous les tests effectués nous avons obtenue à chaque nouveau essai une petite amélioration soit l’erreur quadratique moyenne du réseau diminue soit le nombre de classes détecter augmente donc nous avons déduis que les résultats sont encourageant mais pas satisfaisants pour autant. Nous avons remarqué que l’augmentation de nombre d’itérations a engendré un sur-apprentissage pour certaines classes. 7.3. Hybridation MLP-CLONCLASS Pour la deuxième série de test la fonction utilisée pour la mutation est la suivante : Fonction MUT { Si( l’individu 1 ≠l’individu 2) alors { Si (l’individu 1 et l’individu 2) M alors Si individu 1 > 0 alors Individu1 . Sinon Individu1 Si individu 2 > 0 alors 67 – . Conception et implémentations Individu2 – Sinon Individu1 . – } } Où M : l’ensemble des individus mutés 7.3.1. Influence des paramètres 7.3.1.1. Influence des nombre de populations Dans cette partie, on a fixé tous les autres paramètres et nous effectuons des changements sur le nombre de populations utilisées. Les paramètres sont fixé comme suit : (Nbr Ite AIS ,Nbr Ite MLP, Nbr Neur C C ,β)=(100,50,8,10) Test Nombre de population MLP-AISB MLP-AIS 1 500 0,29741 0,23108 2 100 0,23147 0,21678 3 50 0,22161 0,22505 4 25 0,21663 0,21728 Tableau IV. 9: Influence du nombre de population Le tableau illustré montre une amélioration dans la valeur de l’erreur quadratique moyenne avec la diminution du nombre de populations donc ce dernier influe directement sur les résultats obtenus. 7.3.1.2. Influence du coefficient β Afin de déterminer l’influence du coefficient β utilisé dans la formule qui calcule le nombre de clones on a fixés les paramètres suivants : (Nbr Ite AIS ,Nbr Ite MLP, Nbr Neur C C ,P)=(100,50,8,25) 68 Conception et implémentations Test Coefficient β MLP-AISB MLP-AIS 1 8 0,22328 0,22574 2 5 0,19624 0,21711 3 2,5 0,22642 0,22983 4 0,05 0,22642 0,22983 Tableau IV. 10: Influence du nombre du coefficient β Les résultats illustrés dans le tableau 4. 10 Sont instables pour les deux cas MLPAISB et MLP-AIS. Nous remarquons que pour les deux dernières valeurs nous avons obtenu les mêmes résultats. Cela signifie que la diminution du coefficient β n’engendre pas forcement l’obtention d’une meilleur erreur quadratique moyenne. Influence du nombre d’itérations 7.3.1.3. Dans les deux tableaux suivants nous allons jouer sur le nombre d’itérations des deux algorithmes MLP et AIS « CLONCLASS », En premier lieu on a fixé le nombre d’itérations du MLP et on a changé le nombre d’itérations de l’AIS. Les autres paramètres sont fixés comme suit : (NBR Ite MLP ,Nbr Neur C C ,P,coefficient β) = (50, 8,25, 5) Test Nbr ite AIS MLP-AISB MLP-AIS 1 100 0,19624 0,21711 2 150 0,23424 0,22971 3 200 0,29611 0,23078 4 300 0,29611 0,23845 Tableau IV. 11:Influence du nombre d’itération AIS Dans dette deuxième étape on a fixé le nombre d’itérations de l’algorithme AIS a 100 itérations et on a augmenté le nombre d’itération MLP Les résultats sont illustrés dans le tableau suivant : 69 Conception et implémentations Test Nbr ite MLP MLP-AISB MLP-AIS 1 100 0,18933 0,18052 2 200 0,17404 0,16068 3 300 0,14921 0,14919 4 500 0,14405 0,15220 Tableau IV. 12: Influence du nombre d’itération MLP Les résultats illustrés dans les deux tableaux 4.11 Et 4.12 Indique que le nombre d’itérations du MLP a une grande influence par rapport aux nombre d’itérations de l’AIS. 7.3.2. Test 3 Les paramètres sont fixés comme suit : (NBR Ite MLP ,Nbr Ite AIS ,Nbr Neur C C , P, coefficient β) = (600,100, 8,25, 5) Figure IV. 12: Image classifié du test 3MLP- AISB, EQM=0.15201 ; TC = 19.33 Figure IV. 13: Image classifié du test 3MLPAIS,EQM=0,14665; TC = 23,48 Les résultats obtenus dans les deux figures ne sont pas satisfaisants car nous n’avons pas obtenue toutes les classes et seulement deux ont été bien classées mais les résultats obtenus avec MLP-AIS restent meilleure que ceux obtenus par MLP-AISB 7.3.3. Test 4 Pour ce test nous avons augmenté le nombre d’itérations comme suit 70 Conception et implémentations (NBR Ite MLP ,Nbr Ite AIS ,Nbr Neur C C , P, coefficient β) = (1000,100, 8,25, 5) Figure IV. 14: Image classifié du test 4MLPAISB , EQM=0,15368 ; TC = 19.33 Figure IV. 15: Image classifié du test 4 MLPAIS , EQM=0,14082 ; TC = 23,48 Pour ce test nous avons obtenu de meilleurs résultats par rapport au test précédent, trois classes ont été très bien classées, la confusion de la classe forêt avec la classe céréale a diminué et on a remarqué l’apparition de deux nouvelles classes mais les résultats reste toujours mauvais pour les deux cas MLP-AIS et MLP-AISB. 7.3.4. Test 5 (NBR Ite MLP ,Nbr Ite AIS ,Nbr Neur C C , P, coefficient β) = (2000,100, 8,25, 5) Figure IV. 16: Image classifié du test 5MLPAISB ,EQM = 0.14604 ; TC = 17,08 Figure IV. 17: Image classifié du test 5MLPAIS , EQM = 0,13450 ; TC = 23,36 La différence entre ces deux figures apparait nettement. Et la classification avec MLP-AIS est meilleur qu’avec MLP-AISB on a pu classer quatre classes (mer, ressac, forêt, sebkha 1). L’erreur quadratique moyenne est toujours en diminution pour les deux algorithmes MLP-AIS et MLP-AISB . 71 Conception et implémentations 7.3.5. Test 6 Pour ce test nous avons changé l’échantillonnage à 707 pixels, avec les paramètres fixés comme suit(NBR Ite MLP ,Nbr Ite AIS ,Nbr Neur C C , P, coefficient β) = ( 600,100, 8,25, 5), nous avons obtenu les résultats suivants : Figure IV. 18: Image classifié du test 6MLPAISB ,EQM = 0.10036 ; TC = 12,24 Figure IV. 19: Image classifié du test 6MLPAIS , EQM =0.13420 ; TC = 16,66 Les résultats obtenus dans ce test sont très différents des résultats obtenus précédemment, on remarque l’apparition de plusieurs nouvelles classes mais qui sont mal classés. Les rôles entre le MLP-AIS et le MLP-AISB sont inversé car on a obtenu des meilleurs résultats avec le MLP-AISB Les résultats des tests illustrés dans les figures précédentes sont obtenues en changeant quelque paramètres seulement tel que le nombre d’itération MLP ou l’échantillonnage, et on a remarqué la différence qui apparait d’un test a l’autre donc nous concluant que ces deux paramètres jouent des rôles très importants dans les résultats . Les résultats des tests en générale sont insatisfaisants cela peut être dus à la mauvaise prise des échantillons ou bien aux mauvais choix des autres paramètres. Malgré la diminution de l’erreur quadratique moyenne les résultats de classifications obtenus ne sont pas satisfaisants donc on a pu constater que l’EQM n’est pas un critère de validation à partir duquel on peut obtenir de bonnes classifications. 72 8. Conclusion Ce chapitre a été consacré à l’implémentation et l’illustration des résultats obtenus des tests effectués. Ces tests ont été appliqué sur une image satellitale afin d’obtenir un bon résultat de classification. L’application réalisée nous a permis de pratiquer deux méthodes différentes la première est la méthode MLP-AISb dont la mutation des poids s’effectue en binaire et la deuxième méthode MLP-AIS dont les poids subissent une mutation en mode de présentation réel. L’importance de l’opération de mutation nous a encouragés à modifier dans le concept de celle-ci, premièrement le taux de mutation a été partagé sur plusieurs intervalles selon la valeur de l’affinité du réseau, ensuite ce taux a été calculé par la formule de l’algorithme CLONCLASS. On peut partager les tests effectués en trois groupes le premier groupe des tests a été le déterminant des paramètres adéquats aux meilleurs résultats. Le deuxième groupe de tests a été effectué avec la première méthode de mutation, c'est-à-dire par palier avec deux échantillonnages différents, ensuite le troisième groupe avec le système hybride MLP-CLONCLASS. Les résultats issus des deux méthodes ne sont pas assez différents et ceux obtenus dans la mutation par palier sont meilleurs que ceux obtenus par le MLP-CLONCLASS mais ils restent toujours insuffisants. 73 Conclusion générale Notre travail a été consacré au traitement des données optiques issues du mécanisme de la télédétection (image satellitaire) par une hybridation entre deux méthodes bio-inspirées, le réseau de neurone de type perceptron multicouche optimisé par un système immunitaire artificiel. Pour le système immunitaire artificiel nous avons choisie l’algorithme CLONCLASS grâce à ces performances dans la reconnaissance des formes. Le mécanisme utilisé permet de reconnaitre rapidement les formes déjà rencontré et mémorise des nouvelles formes inconnues. La méthode hybride entre l’algorithme CLONCLASS de l’AIS et l’algorithme du MLP a permis de profiter des avantage de l’un et de l’autre tels que la mémorisation pour l’AIS et la généralisation pour le MLP. Dans le développement de notre approche on a gardé l’architecture du réseau MLP et introduit l’algorithme CLONCLASS pour remplacer celui de la rétro-propagation qui calcul les poids de toutes les couches. L’utilisation de l’AIS en début d’algorithme a facilité l’apprentissage pour le MLP mais nous avons rencontré beaucoup de problèmes tels que les choix des paramètres et l’échantillonnage. Les deux méthodes de mutation ont engendré la réduction de l’intervalle dans lequel les poids du réseau changent. Les tests des deux méthodes MLP-AISB et MLP-AIS nous ont permis de déduire que l’approche utilisé dans l’optimisation des réseaux de neurones de type MLP n’est pas la bonne, car le déroulement de l’algorithme nous a pris beaucoup de temps sans aboutir à une bonne classification donc les résultats obtenus sont insatisfaisants. Comme perspectives nous proposons le changement du principe de modélisation de CLONCLASS (partager la base d'apprentissage en plusieurs blocs de pixels ou chaque bloc représente un antigène) ou bien d’utiliser l’algorithme de l’AIS de façon différente, c’est-à- 74 dire à la fin de la rétro-propagation et non pas au début ou bien de changer complètement l’algorithme de CLONCLASS par la sélection négative ou l’AINET…. . Nous proposons aussi d’ajouter d’autres paramètres d’entrées déterminant pour le réseau tel que la variance. 75 Bibliographie 76 Bibliographie [1] : Amir Mokhtar HANNANE, « optimisation des réseaux de neurones par algorithmes de colonies de fourmis pour la segmentation des images satellitaires », PFE ,USTO , Oran , Algérie 2008. [2] : Mohammed SOUABI et Mustapha SI-TAYEB « conception d’un système hybride neuro markovien RN-MLP & MRF pour la classification des images satellitaires, PFE , USTO, Algérie 2006. [3] : MINVIELLE et SOUIAH ; Livre : L’analyse statistique et spatiale : Statistiques, cartographie, télédétection, SIG ; 2003 ; Roubin ,1995 [4] : Vincent POULAIN1, Jordi INGLADA1, Marc SPIGAI2, Jean-Yves TOURNERETE, Philippe MARTHON3, « Utilisation d’images satellites haute résolution optique et radar pour la mise `a jour de bases de données cartographiques », IEEE Signal Processing Letters, Centre National d’ Etudes Spatiales, Toulouse, France ; 2009. [5] : S.FASLA, M.A.MESSAOUDI « Classification multisources des images satellitaires par les réseaux de neurone RBF(ols) avec l’intégration des données photographiques et radar » ; PFE ; USTO ; Oran ; Algérie ; 2006. [6] : G. CELEUX, E. DIDAY, G. GOVAERT, Y. LECHEVALLIER et H. RALAMBONDRAINY, « Classification automatique des données » ; Bordas ; Dunod ; 1989. [7] : Smaine El KAHILI Boumediene, G.BOUDOUR « Conception d’un système hybride, algorithme génétique et réseau RBF pour une classification d’image satellitaire », PFE ; USTO ; Oran, Algérie, 2004. [9]: Mohammed SALEM, « Maintenance Industrielle Par Réseaux De Neurones », Mémoire De Magister ; Centre Universitaire Mustapha Stambouli Mascara Institut D’Informatique, Algérie,2006. [10]: Zahra ZERDOUMI, « Application des réseaux de neurones artificiels à la poursuite des non linéarités fluctuantes des systèmes satellitaires »,mémoire de magister Université MOHAMED BOUDIAF ; M’sila, Algérie 2006. [11] : Fatiha DJAHAFI et Rachida BENZEKRI, « Développement du Système Immunitaire Artificiel pour le diagnostic des maladies cancéreuse », PFE ; USTO, Algérie 2009. [12] : Marc PARIZEAU, « réseaux de neurones » ; Livre ; Université de Laval ; Automne 2004. [13] : Chahinez Mériem BENTAOUZA & Mohammed Amine RIFFI « Classification automatique des images satellitaires par les réseaux de neurones MLP » ; PFE ;USTO, Algérie ; 2003 [14] : Ecole de Technologie Supérieure, « Perceptron Multicouche », Université du Québec, ENST Bretagne. [15] : HADJDJELLOUL ABBASSIA & SOURI KARIMA, « traitement des images Mammographiques par la méthode AIS » ; Mémoire De Master ; USTO MOHAMED BOUDIAF , 2010. [16] : Hiba KHELIL, « Application des systèmes immunitaires artificiels pour la reconnaissance des formes », publié : MCSEAI-2008 ; USTO MOHAMED BOUDIAF, Oran, Algérie 2007. [17] : Mokhtar GHARBI, « Optimisation grâce aux systèmes immunitaires artificiels », Mémoire De Master2 ; Centre Européen de Réalité Virtuelle EA.3883 . EBV ,2006. [18] : Nadjib GUETTARI « application des systèmes immunitaires artificiels aux images médicales », Mémoire De Magister ; USTO , Algérie 2010. [19] : J.P REVILLARD, « Immunologie », Livre ; université de Boeck, 2001. [20] Yanfei ZHONG, Liangpei Zhang Jianya GONG, Pingxiang LI ,«A Supervised Artificial Immune Classifier for Remote-Sensing Imagery», IEEE transactions on geoscience and remote sensing, December 2007. [21] : Yahia CHABANE, « élaboration d’un contrôleur adaptatif pour un robot mobile basé sur les réseaux immunitaires artificiels », Mémoire De Magister , USDB (Université Saad Dahlab, Blida, Algérie, 2006. [22] : A. DENECHE, S. MESHOUL, M. BATOUCHE, « Une approche hybride pour la reconnaissance des formes en utilisant un Système Immunitaire Artificiel », Université Mentouri, Constantine ; Algérie, 2007. [23] : Ines LABED, «Proposition d’un système immunitaire artificiel pour la détection d’intrusions », Université Mentouri De Constantine,Algérie, 2006. [Net 1] : Guy ALMOUZNI ; « Traitement numérique des images », 2012. Tipoly.pdf [Net2] : classification supervisée http://prisma.insa- lyon.fr/[email protected] [Net 3] : http://www.img.univ-mlv.fr/dr/XPOSE2002/neurones [Net 4] : Réseau de neurones : http://fr.wikipedia.org/wiki [Net 5] : Le système immunitaire cellules, molécules et organes de l’immunité » : http://_SYSTEME IMMUNITAIRE.htm. [Net6] : « Le système immunitaire : qu’est ce que ? » : http:// www.passportsante.net/fr/maux/problemes/articleinteret.aspx?doc=comprendre_systeme_ immunitaire_mantha_2004_pm. [Net7] :« Encodage » :http://fr.wikipedia.org/wiki/Algorithmeg%C3%A9n%C3%A9 tique. Résumé : Les images satellitaires à l’état brut sont bruitées, peu contrasté et difficilement exploitables, c’est la raison pour la quelle on effectue sur ces images des prétraitements et des traitements tel que la classification et la segmentation afin de mieux les exploiter. Dans notre étude nous nous intéressons aux traitements des donnés optiques issus de la télédétection spécifiquement la classification des différents pixels d’une image satellitaire on utilisant un modèle hybride entre deux méthodes bio-inspirées. Le principe de notre d’optimiser les réseaux de neurone de type perceptron multicouche approche est par un système immunitaire artificiel afin d’essayé de palier les limitations des deux approches. Mots clés : données optiques, télédétection, classification, réseaux de neurones perceptron multicouche, systèmes immunitaires artificiels. Abstract : In their original form the Remote sensing images are noisy, low contrasted and difficult to use it is the reason for which they rescuer a pretreatment and a treatment as segmentation and classification to exploit them better. Our study is focused on treatment of optical data which is results from the remote sensing specifically in the classification of different pixels of a remote sensing image using a hybrid model of two bio-inspired methods. The objective of our approach is to optimize a neuronal network (multiple layer preceptors) by an artificial immune system to mitigate the limitations of both approaches. Key words : optical data, remote sensing, classification, neuronal network(multiple layer preceptors), artificial immune system.