REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE Ministère de l’Enseignement Supérieur et de la Recherche Scientifique Université des Sciences et de la Technologie d’Oran Université Amar Thelidji de Laghouat Faculté de Génie Electrique Département d’Electrotechnique Faculté des sciences et sciences de l’ingénieur Département de Génie Electrique Ecole Doctorale en Génie Electrique MEMOIRE En vue de l’obtention du diplôme de Magister en Electrotechnique Option : Haute tension et Environnement Présenté par : Riad Lakhdar KHERFANE Thème : Exploration de différentes techniques de l'intelligence artificielle pour la prédiction du contournement électrique des isolateurs haute tension dans leur environnement réel Soutenue publiquement le : 04-10-2011 devant la commission d’examen composée de : Président : -Mr FLAZI Samir Prof Rapporteur : -Mr ZEGNINI Boubakeur M .C/A USTOMB-ORAN Université de Laghouat Examinateurs : -Mr HADI Hocine Prof USTOMB-ORAN -Mr MAHI Djillali Prof USTOMB-ORAN -Mr BOUTHIBA Tahar Prof USTOMB-ORAN Abstract: High voltage insulators form an essential part of the high voltage electric power transmission systems.Any failure in the satisfactory performance of high voltage insulators will result in considerable loss of capital, as there are numerous industries that depend upon the availability of an uninterrupted power supply. The importance of the research on insulator pollution has been increased considerably with the rise of the voltage of transmission lines. In order to determine the flashover behavior of polluted high voltage insulators and to identify to physical mechanisms that govern this phenomenon, the researchers have been brought to establish a modeling. Artificial intelligent techniques have been used by various researches for modeling and predictions in the field of energy engineering systems. The phenomenon of flashover in polluted insulators has not yet been described accurately through a mathematical model. The main difficulty lies in the definition of the constants of the arc, which is formed in the dry bands when the voltage exceeds its critical value. First this work present an optimisation method based on genetic algorithms for the determination of the arc constants, using experimental results from artificially polluted insulators. The well known model of Obenhaus for pollution flashover is used. This model results in a system of equations which cannot be solved with conventional arithmetic methods. The application of genetic algorithms enables the definition of the arc constants, resulting also in the calculation of the critical conditions at the beginning of the pollution flashover mechanism. In this way a mathematical model is established, which simulates accurately the experimental results. Second this work attempts to apply an artificial neural network in order to estimate the critical flashover voltage on polluted insulators. The artificial neural network uses as input variables the following characteristics of the insulator: diameter, height, creepage distance, form factor and equivalent salt deposit density, and estimates the critical flashover voltage. The data used to train the network and test its performance is derived from experimental measurements and a mathematical model. Keywords: High voltage insulators; Polluted insulators; Critical flashover voltage; Genetic algorithms ; Artificial neural network. Résumé: Les isolateurs HT constituent une partie essentielle des systèmes de transport de l’énergie électrique. Tout échec dans la performance de ces isolateurs mène à des pertes économiques considérables, à cause du nombre d’industries qui dépendent de la disponibilité d’une source d’énergie sans interruption. L’importance des investigations sur les isolateurs HT a augmenté avec l’augmentation de la tension des lignes de transport. Dans le but de déterminer le comportement du contournement des isolateurs pollués et d’identifier le mécanisme physique qui gouverne ce phénomène, les chercheurs ont essayé de le modéliser par plusieurs méthodes, notamment les techniques de l’intelligence artificielle. Les modèles mathématiques existants ne décrivent pas précisément le phénomène du contournement des isolateurs pollués et la principale cause reste la définition des constantes de l’arc qui apparait au niveau des zones sèches, lorsque la tension dépasse la valeur critique. Premièrement ce travail présente une méthode d’optimisation basée sur les algorithmes génétiques(AG) pour la détermination des constantes de l’arc, en utilisant des résultats expérimentaux sur des isolateurs pollués artificiellement. Pour cela on a utilisé le modèle le plus connu d’Obenaus du contournement de la pollution. L’application de l’AG a permit de définir les constantes de l’arc d’où l’établissement d’un modèle qui simule avec grande précision les résultats expérimentaux. Deuxièmement ce travail essaye d’appliquer un réseau de neurones artificiel (RNA) dans l’ordre d’estimer la tension critique du contournement d’un isolateur pollué. Le RNA utilise comme variables d’entrées les caractéristiques de l’isolateur (Diamètre, Hauteur, Longueur de la ligne de fuite, Facteur de forme, DDSE (Densité de Dépôt en Sels Equivalente)) et estime la tension critique de contournement. La base de données utilisée pour l’apprentissage du RNA et le test de ces performances dérivent des mesures expérimentales et du modèle mathématique. Mots clés : Isolateur haute tension, Isolateur pollué, Tension critique du contournement, Algorithmes génétiques, Réseaux de neurones artificiels. :ﻣﻠﺨﺺ و ﻛﻞ ﺧﻠﻞ ﻓﻲ ھﺬه اﻟﻌﻮازل ﯾﺆدي إﻟﻰ ﺧﺴﺎﺋﺮ ﻣﺎدﯾﺔ ﻣﻌﺘﺒﺮة ﺑﺴﺒﺐ اﻟﻌﺪد اﻟﻤﺘﺰاﯾﺪ ﻣﻦ اﻟﺼﻨﺎﻋﺎت اﻟﺘﻲ ﺗﺘﻄﻠﺐ ﻣﺼﺪرا،ﺗﻤﺜﻞ ﻋﻮازل اﻟﺘﻮﺗﺮات اﻟﻌﺎﻟﯿﺔ ﻣﻜﻮﻧﺔ ﻣﮭﻤﺔ ﻣﻦ أﻧﻈﻤﺔ ﻧﻘﻞ اﻟﻄﺎﻗﺔ اﻟﻜﮭﺮﺑﺎﺋﯿﺔ .ﻟﻠﻄﺎﻗﺔ اﻟﻜﮭﺮﺑﺎﺋﯿﺔ ﺑﺪون اﻧﻘﻄﺎع ﻓﺎﻧﺼﺐ اﻟﺒﺎﺣﺜﻮن ﻋﻠﻰ ﻣﺤﺎوﻟﺔ إﯾﺠﺎد ﻧﻤﻮذج ﻟﺸﺮح ﺳﻠﻮك و اﻟﻤﯿﻜﺎﻧﯿﺰﻣﺎت.زﯾﺎدة ﻗﯿﻢ اﻟﺘﻮﺗﺮات ﻓﻲ أﻧﻈﻤﺔ ﻧﻘﻞ اﻟﻄﺎﻗﺔ اﻟﻜﮭﺮﺑﺎﺋﯿﺔ زاد ﻣﻦ أھﻤﯿﺔ اﻷﺑﺤﺎث اﻟﺠﺎرﯾﺔ ﻋﻠﻰ ﻋﻮازل اﻟﺘﻮﺗﺮات اﻟﻌﺎﻟﯿﺔ . اﻟﺬﻛﺎء اﻻﺻﻄﻨﺎﻋﻲ،اﻟﻔﯿﺰﯾﺎﺋﯿﺔ ﻟﻈﺎھﺮة اﻻﻟﺘﻔﺎف ﻓﻲ اﻟﻌﻮازل و ﻣﻦ ﺑﯿﻦ اﻟﺘﻘﻨﯿﺎت اﻟﻤﺴﺘﻌﻤﻠﺔ ﻓﻲ ھﺬا اﻟﻤﺠﺎل .اﻟﻨﻤﺎذج اﻟﺮﯾﺎﺿﯿﺔ اﻟﻤﻮﺟﻮدة ﺣﺎﻟﯿﺎ ﻻ ﺗﺤﺎﻛﻲ ﺑﺪﻗﺔ ﻇﺎھﺮة اﻻﻟﺘﻔﺎف و اﻟﺴﺒﺐ ﻓﻲ ذﻟﻚ ھﻮ ﺗﻌﺮﯾﻒ ﺛﺎﺑﺘﺎ اﻟﻘﻮس اﻟﻜﮭﺮﺑﺎﺋﻲ اﻟﺬي ﯾﻈﮭﺮ ﻓﻲ اﻟﻤﻨﺎﻃﻖ اﻟﺠﺎﻓﺔ ﻋﻨﺪﻣﺎ ﯾﺼﻞ اﻟﺘﻮﺗﺮ إﻟﻰ اﻟﻘﯿﻤﺔ اﻟﺤﺮﺟﺔ ﻣﻦ أﺟﻞ ھﺬا اﺳﺘﻌﻤﻠﻨﺎ ﻧﻤﻮذج.أوﻻ ﯾﻘﺪم ھﺬا اﻟﻌﻤﻞ ﻃﺮﯾﻘﺔ ﺗﺤﺴﯿﻦ ﺗﻌﺘﻤﺪ ﻋﻠﻰ اﻟﺨﻮارزﻣﯿﺎت اﻟﺠﯿﻨﯿﺔ ﻣﻦ أﺟﻞ ﺗﺤﺪﯾﺪ ﺛﺎﺑﺘﺎ اﻟﻘﻮس اﻟﻜﮭﺮﺑﺎﺋﻲ ﺑﺎﺳﺘﻌﻤﺎل ﻗﯿﻢ ﺗﺠﺮﯾﺒﯿﺔ أﺧﺬت ﻋﻠﻰ ﻋﻮازل ﻣﻠﻮﺛﺔ ﻃﺒﯿﻌﯿﺎ . ﻣﻤﺎ ﺳﻤﺢ ﺑﺘﺤﺪﯾﺪ ﺛﺎﺑﺘﺎ اﻟﻘﻮس و ﻣﻦ ﺛﻤﺔ اﻟﺤﺼﻮل ﻋﻠﻰ ﻧﻤﻮذج ﯾﺤﺎﻛﻲ ﺑﺪﻗﺔ ﻛﺒﯿﺮة اﻟﻨﺘﺎﺋﺞ اﻟﺘﺠﺮﯾﺒﯿﺔ.اوﺑﻨﺎوس ﻟﻼﻟﺘﻔﺎف ﻋﻠﻰ ﻣﻨﻄﻘﺔ ﻣﻠﻮﺛﺔ و ھﻮ اﻟﻨﻤﻮذج اﻷﻛﺜﺮ اﺳﺘﻌﻤﺎﻻ ، اﻻرﺗﻔﺎع، ﺗﺴﺘﻌﻤﻞ اﻟﺸﺒﻜﺔ ﻛﻤﺘﻐﯿﺮات اﻟﺪﺧﻮل ﺧﺼﺎﺋﺺ اﻟﻌﺎزل )اﻟﻘﻄﺮ.ﺛﺎﻧﯿﺎ ﺣﺎوﻟﻨﺎ ﻓﻲ ھﺬا اﻟﻌﻤﻞ ﺗﻄﺒﯿﻖ ﺷﺒﻜﺔ اﻟﺨﻼﯾﺎ اﻟﻌﺼﺒﯿﺔ اﻟﺼﻨﺎﻋﯿﺔ ﻣﻦ أﺟﻞ ﺗﻘﺪﯾﺮ اﻟﺘﻮﺗﺮ اﻟﺤﺮج ﻟﻼﻟﺘﻔﺎف ﻟﻌﺎزل ﻣﻠﻮث . و ﺗﻘﺪر اﻟﺘﻮﺗﺮ اﻟﺤﺮج ﻟﻼﻟﺘﻔﺎف،(( )اﻟﻜﺜﺎﻓﺔ اﻟﻤﻜﺎﻓﺌﺔ ﻟﺘﺮﺳﺐ اﻷﻣﻼحDDSE ، ﻋﺎﻣﻞ اﻟﺸﻜﻞ،ﻃﻮل ﺧﻂ اﻟﺘﺴﺮب . أﺧﺬت ﻣﻦ ﻗﯿﺎﺳﺎت ﺗﺠﺮﯾﺒﯿﺔ و ﻣﻦ اﻟﻨﻤﻮذج اﻟﺮﯾﺎﺿﻲ، ﻟﺘﺪرﯾﺐ اﻟﺸﺒﻜﺔ و اﺧﺘﺒﺎر ﻋﻤﻠﮭﺎ،ﻗﺎﻋﺪة اﻟﺒﯿﺎﻧﺎت اﻟﻤﺴﺘﻌﻤﻠﺔ . ﺷﺒﻜﺔ اﻟﺨﻼﯾﺎ اﻟﻌﺼﺒﯿﺔ اﻟﺼﻨﺎﻋﯿﺔ، اﻟﺨﻮارزﻣﯿﺎت اﻟﺠﯿﻨﯿﺔ، اﻟﺘﻮﺗﺮ اﻟﺤﺮج ﻟﻼﻟﺘﻔﺎف، ﻋﺎزل ﻣﻠﻮث، ﻋﺎزل ﺗﻮﺗﺮ ﻋﺎﻟﻲ:اﻟﻜﻠﻤﺎت اﻟﻤﻔﺘﺎﺣﯿﺔ Sommaire Introduction générale…………………………..………………………………………. 11 Chapitre I : Le phénomène du contournement………………………….……………… 14 I.1- Introduction………………………………………………………………………... 15 I.2- La décharge électrique dans les gaz……………………………………………….. 15 I.1.2- Définition…………………………………………………………………. 15 I.2.2- Les types de décharges électriques……………………………………….. 15 I.2.3- Les mécanismes du claquage……………………………………………... 16 I.2.3.1- Mécanisme de Townsend………………………………………… 16 I.2.3.2- Le mécanisme de streamer……………………………………….. 18 I.2.4- La décharge surfacique…………………………………………………… 21 I.2.4.1- Définition………………………………………………………… 21 I.2.4.2- Mécanisme du contournement de la surface …………………….. 21 I.3- Contournement des isolateurs pollués …………………………………………….. 22 I.3.1- Processus de contournement des surfaces polluées ……………………… 22 I.3.2- Le mécanisme de contournement des isolateurs pollués …………………. 23 I.3.3- Paramètres d’influence …………………………………………………… 29 I.3.3.1- Influence de la longueur de la ligne de fuite …………………….. 29 I.3.3.2- Influence du diamètre ……………………………………………. 29 I.3.3.3- Influence de la forme de l’isolateur …………………………….. 33 I.3.3.4- Influence de la DDSE …………………………………………... 34 I.4- Conclusion ………………………………………………………………………… 36 Chapitre II : Algorithmes génétiques ……..…………………………………………… 37 II.1- Introduction ………………………………………………………………………. 38 II.2- Algorithmes évolutionnaires ……………………………………………………... 39 II.3- Algorithmes génétiques…………………………………………………………... 40 II.3.1- Théorie des algorithmes génétiques AG ………………………………… 41 4 II.3.2- Principe de fonctionnement des algorithmes génétiques AG …………… 41 II.3.3- Les caractéristiques des algorithmes génétiques ………………………... 43 II.3.3.1- Codage ………………………………………………………….. 43 II.3.3.2- Espace de recherche des solutions ……………………………… 45 II.3.3.3- Fonction d'évaluation (fitness) et le hasard …………………….. 46 II.3.4- Opérateurs génétiques …………………………………………………… 47 II.3.4.1- Opérateur de sélection ………………………………………….. 47 II.3.4.2- Opérateur de croisement ou Crossover …………………………. 49 II.3.4.3- Opérateur de mutation ………………………………………….. 52 II.3.4.4- Opérateur de remplacement …………………………………….. 53 II.3.5- Critères de convergence …………………………………………………. 54 II.3.6- Avantages et inconvénients des algorithmes génétiques ………………... 55 II.3.6.1- Avantages des AG ……………………………………………… 55 II.3.6.2- Inconvenient des AG …………………………………………… 55 II.4- Conclusion ………………………………………………………………….......... 56 Chapitre III : Réseaux de neurones ………………………………………………......... 57 III.1- Introduction ……………………………………………………………………... 58 III.1.1- Modèle du neurone formel ……………………………………………... 59 III-2 Réseaux de neurones supervises ……………………………………...….............. 61 III-2.1 Mémoire associative linéaire ……………………………………………. 61 III.2.1.1- Apprentissage ………………………………………………….. 61 III.2.2- Réseaux de Hopfield ……………………………………………………. 62 III.2.2.1- Dynamique du réseau ………………………………………….. 63 III.2.2.2- Evolution de l'énergie ………………………………………….. 64 III.2.2.3- Application au cas des MA ……………………………………. 64 III.2.3- Limitations des MA …………………………………………………….. 65 III.2.4- Perceptron ………………………………………………………………. 66 III.2.5- Adaline …………………………………………………………………. 66 5 III.2.6- Limitations ……………………………………………………………… 67 III.2.7- Rétropropagation du gradient …………………………………………... 67 III.2.7.1- Une couche …………………………………………………….. 67 III.2.7.2- Deux couches ………………………………………………….. 68 III.2.7.2.1- Remarques sur l'utilisation de la rétropropagation ……. 70 III.3- Réseaux de neurones non-supervises …………………………………...………. 71 III.3.1- Winner Take All (WTA) ……………………………………………….. 71 III.3.2- Carte de Kohonen ………………………………………………………. 73 III-4. Conclusion ………………………………………………………………………. 76 Chapitre IV : Applications, résultats et discussions …………………………………… 77 IV.1- Introduction ……………………………………………………………………... 78 IV.2- Procédures expérimentales et collection de données …………………………… 79 IV.3- Les algorithmes génétiques ………………………………………………...…… 80 IV.3.1- Model mathématique …………………………………………………… 81 IV.3.2- Détermination des constantes de l’arc « A » et « n » …………………... 83 IV.3.3- Application à l’estimation de la tension de contournement ……………. 84 IV.3.4- Application et résultats ………………….……………………………… 86 IV.3.4.1- Validation ……………………………………………………… 88 IV.4- Réseaux de neurones …………………………………………………................. 90 IV.4-1 L’algorithme RNA (algorithme réseaux de neurones) …………………. 90 IV.4.2- Réseau de neurones artificiel …………………………………………… 92 IV.4.3- Application des RNA pour l’estimation de la tension de contournement. 94 IV.5- Conclusion ………………………………………………………………………. 101 Conclusion générale …………………………………………………………………… 102 Bibliographie ……………………………………………………………………........... 105 6 Liste des abréviations et symboles A Constante de l’arc AC Courant alternatif AG Algorithme génétique C DDSE D Diamètre moyen de l’isolateur DDSE Densité de dépôt en sels équivalente E Champ électrique F Facteur de forme Fp Facteur de profil H Hauteur I Courant IC Intervalle de confiance IEC International electrotechnical commission Ic Courant critique L Longueur de la ligne de fuite Logsig Fonction sigmoïde MAE L’erreur absolue moyenne n Constante de l’arc purelin Fonction linéaire NaCl Chlorure de sodium R Résistance 2 R La corrélation RMSE Racine carrée de l’erreur moyenne RNA Réseau de neurones artificielles rp Résistance par unité de longueur Rr Résistance résiduelle SD Variance standard Tansig Fonction tangente hyperbolique U Tension Uarc Tension de l’arc 9 Uc Tension critique v Vitesse x Longueur de l’arc xc Longueur critique de l’arc xp Longueur de la couche de pollution α Premier coefficient de Townsend γ Deuxième coefficient de Townsend σ La conductance constante à la queue de la décharge 10 LISTE DES FIGURES Figure I-1 : Distribution de la charge d’espace dans l’avalanche électrique et la distorsion du champ appliqué Eex…. 19 Figure I-2 : Diagramme schématique de la propagation d’un streamer……………………………………………………. 20 Figure I-3 : Les stades du contournement d’une surface polluée…………………………………………………………... 23 Figure I-4: Modèle physique du développement de l’arc électrique………………………………………………………... 24 Figure I-5: Résultats expérimentaux, obtenus sur trois types d’isolateurs………………………………………………… 29 Figure I-6: Assimilation théorique d'un isolateur a un cylindre……………………………………………………………. 30 Figure I-7: Diamètre moyen des isolateurs IEEE et EPDM……………………………………………………………….. 31 Figure I-8: Performance des isolateurs pollues en fonction du diamètre moyen…………………………………………. 32 Figure I-9 : La DDSE en fonction du diamètre moyen…………………………………………………………………… 32 Figure I-10: Influence du profil sur le mécanisme de contournement……………………………………………………… 33 Figure I-11 : Définition du facteur de profil…………………………………………………………………………………….. 33 Figure I-12: Influence du profil sur la tension de contournement des isolateurs………………………………………….. 34 Figure I-13: Variation de la tension de contournement en fonction de la DDSE………………………………………….. 34 Figure I-14 : Valeurs de la DDSE durant toute la saison dans différentes zones………………………………………… 35 Figure II-1 : Organigramme d'un algorithme évolutionnaire…………………………………………………………………. 38 Figure II-2: Schéma du principe des algorithmes génétiques………………………………………………………………. 42 Figure II-3 : algorithme génétique canonique…………………………………………………………………………………. 42 Figure II -4: Les cinq niveaux d'organisation d'un algorithme génétique…………………………………………………. 44 Figure II-5: Illustration schématique du codage des variables réelles……………………………………………………… 45 Figure II-6: La roulette…………………………………………………………………………………………………………… 49 Figure II-7: Croisement avec un point de Crossover…………………………………………………………………………. 50 Figure II-8 : Croisement avec 2 points de Crossover………………………………………………………………………… 51 Figure II-9 : Croisement uniforme………………………………………………………………………………………………. 51 Figure II-10: Une mutation………………………………………………………………………………………………………. 52 Figure II-11: Critère de convergence…………………………………………………………………………………………... 54 Figur e III-1. Représentation schématique d'un neurone biologique……………………………………………………….58 Figure III-2. Schéma d'un neurone formel…………………………………………………………………………………… 60 Figure III-3. Compétition à deux couches : m odèle I NST AR…………… …… …………… ………… …… ………. 72 Figure III- 4. Compétition sur une couche……………………………………………………………………………………… 73 Figure III-5 a) Schématisation d'une carte de Kohonen. b) Représentation d'une différence de 2 gaussiennes………. 74 Figure IV-1 : Circuit électrique équivalent du model d’Obenaus……………………………………………………………. 81 Figure IV-2 : convergence des constantes de l’arc…………………………………………………………………………... 88 Figure IV-3 : La tension critique en fonction de la DDSE……………………………………………………………………. 89 7 Figure IV-4 : Comparaison entre le modèle de Gonos et le modèle proposé…………………………………………….. 89 Figure IV-5 : Les grandes lignes du processus de construction du RNA adapté………………………………………..... 91 Figure IV-6 : RMSE pour une couche cachée………………………………………………………………………………… 94 Figure IV-7 : La RMSE et la MAE en fonction du nombre de neurones…………………………………………………… 95 Figure IV-8 : La RMSE pour 2 couches cachées…………………………………………………………………………….. 95 -3 Figure IV-9 : La corrélation pour les valeurs de l’apprentissage (RMSE=4.10 kV) ……………………………………… 97 -3 Figure IV-10 : La corrélation pour les valeurs de test (RMSE=4.10 kV)…………………………………………………... 97 Figure IV-11 : La RMSE en fonction des itérations…………………………………………………………………………... 98 Figure IV-12 : Situation des valeurs expérimentales et estimées par le RNA par rapport à l’intervalle de confiance… 99 Figure IV-13 : Comparaison entre les valeurs du modèle mathématique et celles du RNA …………………………... 100 Figure IV-14 : Comparaison entre l’erreur relative du modèle mathématique et celle du RNA ………………………… 100 8 Introduction générale Introduction générale : L’un des principaux objectifs dans la conception des équipements des réseaux de transport et de distribution de l’énergie électrique consiste à les rendre fiables quelque soient les conditions environnementales. Ces conditions peuvent être liées à divers facteurs tels que la pollution, la pression atmosphérique, la température, ….etc. Parmi les équipements électriques constituant les réseaux aériens, un intérêt particulier doit être porté aux isolateurs qui constituent un élément essentiel pour le bon fonctionnement de ces derniers et cela, malgré le fait qu’ils représentent un faible pourcentage dans le coût total de conception. En effet, leur défaillance peut avoir une grande influence sur les coûts d’exploitation des réseaux électriques, puisque leur rôle est d’assurer l’isolement électrique des phases sous tension entre elles, et entre ces dernières et les parties mises à la terre. Ainsi les isolateurs sont les plus exposés aux accumulations de pollution et peuvent être affectés de façon importante par les surtensions transitoires qui sont capables de dépasser leur limite de tenue diélectrique en tout temps. Cela se traduit généralement par des contournements électriques pouvant conduire à des interruptions plus ou moins longues de la distribution de l’énergie électrique et à des pertes économiques importantes. Un contournement électrique se traduit par un court-circuit, entre la partie portée à la haute tension et la mise à la terre, créé par un arc électrique s’établissant généralement à la surface de la couche de pollution recouvrant l’isolateur. Les résultats des mesures aux essais artificiels en laboratoire permettent de déterminer le profil des isolateurs et la longueur de la chaîne qui représente les meilleures performances dans les conditions de pollution du site étudié. La forme de l'isolateur est généralement conçue pour obtenir une ligne de fuite maximale entre les deux conducteurs. En effet, ces essais sont non seulement très coûteux, mais nécessitent du matériel très long à réaliser pour suivre des phénomènes très complexes à savoir la propagation des décharges le long des isolateurs dans leurs environnements réel. Sur le plan économique les systèmes intelligents gagneraient d’être utiliser dans le domaine de la haute tension, surtout dans l’étude à la tenue au contournement des isolateurs. Ces techniques permettent de diminuer le travail 11 Introduction générale expérimental et prédire les valeurs des paramètres d’influences caractérisant ce processus d'où un gain de temps considérable, et la diminution du nombre et de la durée des interruptions de l'alimentation en énergie électrique des consommateurs. Objectif de ce travail Le but de ce travail est d’exploiter les techniques de l’intelligence artificielle dans la prédiction du phénomène de contournement d’un isolateur pollué dans son environnement réel. En premier on va appliquer l’AG sur l’équation du modèle mathématique d’Obénaus en introduisant les caractéristiques de 14 types d’isolateurs afin de déterminer les valeurs des constantes de l’arc A et n Ce résultat est utilisé pour construire la base de données sur laquelle repose l’apprentissage des RNA. On passe ensuite à la recherche de la meilleur structure des RNA, et cela en changeant à chaque fois les paramètres du RNA (numéro de l’arrangement, le nombre de neurones, le nombre de couches cachées, le nombre d’itérations et la fonction d’activation). En fin on va procéder à une analyse statistique en établissant un intervalle de confiance pour vérifier .la précision des résultats obtenus. Structure du mémoire Le premier chapitre est basé sur une étude bibliographique consacrée aux notions fondamentales entourant le processus de contournement des isolateurs pollués et les différents facteurs influençant sur la tension de tenue, notamment le degré de pollution, ainsi que le modèle mathématique de prédiction du contournement associé. Une idée générale sur les algorithmes génétiques est présentée dans le deuxième chapitre, en commençant par des généralités sur les bases des algorithmes génétiques et en terminant par l’explication de la méthodologie à suivre. Dans le chapitre III on a tenté de chercher la meilleure structure capable de prédire la tension critique de contournement en fonction du degré de pollution. 12 Introduction générale Le chapitre IV est une application de ces deux méthodes sur le phénomène de contournement. L’algorithme génétique est utilisé pour la détermination des constantes de l’arc du modèle d’Obenaus pour cela on va utiliser les caractéristiques de 14 types d’isolateurs. Une fois les constantes de l’arc déterminées, on va les utiliser pour construire une base de donnés pour l’apprentissage des RNA. Après on procède à une petite analyse statistique des résultats des RNA, tout en discutant les résultats en se referant à d’autre travaux. 13 Chapitre I Le phénomène du contournement des isolateurs pollués Chapitre 1 Le phénomène du contournement des isolateurs pollués I.1- Introduction : Le défaut de contournement des isolateurs des systèmes énergétiques, causé par des conditions climatiques et environnementales sévères, peut apparaître occasionnellement. En effet ; ce phénomène (le contournement) est un type de décharges électriques, et plus précisément c’est une décharge surfacique. Ce chapitre donne une idée sur les principes physiques de la décharge électrique dans les gaz et au long des interfaces gaz-solide. Quelques types de décharges électriques dans les gaz et leurs mécanismes et caractéristiques peuvent être introduits par les théories principales qui concernent la décharge sur les surfaces polluées. L’effet de certains paramètres va être aussi discuté plus tard. I.2- La décharge électrique dans les gaz : I.1.2- Définition : Le gaz dans son état normal est un bon isolateur mais lorsqu’un champ électrique suffisamment grand est appliqué entre deux électrodes dans un gaz, ce dernier peut devenir conducteur. La décharge électrique dans les gaz est un phénomène provoqué par un écoulement d’un courant électrique à l’intérieur du gaz. Un gaz peut présenter une conductivité seulement s’il possède des charges libres. L’ionisation et l’émission électronique sont les deux principales origines des charges libres, où : L’ionisation est le processus de libération d’électrons des particules du gaz. L’émission électronique c’est le processus de libération des électrons à partir des surfaces solides des électrodes. I.2.2- Les types de décharges électriques : Il y a plusieurs types de décharges électriques, leur classification se fait suivant des critères spécifiques. Basée sur son apparence la décharge électrique peut être divisée en 4 principaux types : 15 Chapitre 1 Le phénomène du contournement des isolateurs pollués La décharge lumineuse (Glow discharge) est le phénomène de la diffusion lumineuse dans l’espace entre deux électrodes. La décharge couronne est un type de décharges partielles observées à l’intérieur d’un champ électrique non uniforme. Elle a une petite zone lumineuse entourant l’électrode. Le canal de l’arc est une région complètement ionisée du gaz. Il est donc très chaud plasma, très brillant et à une très grande densité de courant. L’étincelle (spark discharge) est aussi une zone complètement ionisée du gaz mais elle est transitive. Si l’énergie fournie n’est pas suffisamment grande, il y aura une mince étincelle intermittente observée entre les électrodes. La décharge électrique se divise en décharge autonome et non-autonome. La décharges non autonome exige des facteurs externes (radiations naturelles ou artificielles) pour maintenir l’ionisation. Les facteurs externes sont essentiels pour la continuité de la décharge. La décharge autonome ne dépend pas des facteurs externes son maintien est assuré seulement par le champ électrique appliqué. I.2.3- Les mécanismes du claquage : Si la décharge traverse complètement la distance entre électrodes ce qui mène la tension au voisinage de zéro, on l’appel « claquage » électrique. Il y a deux principales théories qui expliquent le processus du claquage électrique. La première, est le mécanisme de décharge de Townsend, la deuxième c’est le mécanisme du streamer. I.2.3.1- Mécanisme de Townsend : Le mécanisme de Townsend est décrit comme suit : a) Le courant résultant du processus α : Lorsqu’un électron se déplace dans un gaz, il peut entrer en collision avec d’autres particules et peut ainsi ioniser les molécules du gaz et générer de nouveaux électrons. Ce processus est appelé le processus α. Le nouvel électron libéré peut 16 Chapitre 1 Le phénomène du contournement des isolateurs pollués libérer un autre électron de la même façon jusqu’avoir un groupe d’électrons qu’on le nome avalanche. Dans le cas d’un champ électrique uniforme le courant I augmente exponentiellement en fonction de la distance x séparant les électrodes comme suit : I I 0 e x (I-1) Où I0 est le courant causé par les électrons initiaux émis par la cathode. α est le premier coefficient d’ionisation de Townsend, et qui indique le nombre de collisions ionisantes provoquées par un électron se déplaçant le long du champ électrique E par unité de longueur. α peut être déterminée aussi : A0 e P B0 P E (I-2) Où P est la pression de l’air ; A0 et B0 sont des constantes dépendant de la température du gaz [Yu-06]. b) Le courant résultant du processus α et γ : Lorsque les ions positifs bombardent la cathode, ils provoquent une deuxième émission électrique, qui est appelé le processus. Le coefficient indique le nombre des électrons libérés lors du bombardement de la cathode par les ions positifs. Alors dépend de la matière et de l’état de la surface de la cathode. Les valeurs typiques de sont de l’ordre de 10-2 à 10-3 et 0,01 pour l’air . Le courant résultant du processus α et peut être déterminé par l’équation suivante : I I0 e d 1 ed (I-3) c) Condition de l’autonomie de la décharge : Avec l’augmentation de la tension appliquée, le champ électrique augmente, ce qui mène à l’augmentation de α et e d jusqu’à ce que e d s’approche de 1. Le dénominateur de l’équation (I-3) s’approche alors de zéro et I tend vers l’infini. Quand le courant s’approche de l’infini la décharge devient autonome. 17 Chapitre 1 Le phénomène du contournement des isolateurs pollués Donc la condition d’autonomie de la décharge dans un champ uniforme peut être exprimée comme suit : d k Ln 1 (I-4) Dans le cas d’un champ uniforme cette équation est la condition du claquage dans les gaz. La valeur de k typiquement dans l’intervalle est de 4 à 7 quand est de l’ordre -2 de 10 à 10-3 . I.2.3.2- Le mécanisme de streamer : Lorsque le produit de la pression de l’air (P) et la distance entre les électrodes (d), P·d, est plus grand que 150 mm Hg.cm, l’effet des charges de l’espace ne peut pas être négligé. Pour cette raison le mécanisme de claquage de streamer est avancé pour aider à développer le mécanisme de décharge de Townsend. Le mécanisme de claquage de streamer peut être décrit comme suit : a) La déformation du champ appliqué par la charge d’espace dans l’avalanche électronique : A cause de la différence entre la vitesse de mouvement des électrons et des ions positif, plusieurs charges d’espaces apparaissent dans la première avalanche électronique (Fig I-1.a). Ces charges d’espace provoquent la déformation du champ électrique. L’intensité du champ électrique à la tête et la queue de la charge d’espace augmente, mais entre les charges d’espaces négatives et positives le champ diminue (Fig I-1.b). [Yu-06] 18 Chapitre 1 Le phénomène du contournement des isolateurs pollués Figure I-1 : Distribution de la charge d’espace dans l’avalanche électrique et la distorsion du champ appliqué Eex b) Le processus du streamer : L’augmentation du champ à la tête de l’avalanche électronique peut provoquer l’excitation des atomes. Plusieurs photons vont être émis lorsque les atomes retournent à leur état normal. Ces photons vont provoquer la photo ionisation d’autres atomes et des avalanches auxiliaires vont apparaître. Après que l’avalanche principale aura traversé la distance entre les électrons, les électrons vont être absorbés par l’anode et les ions positifs vont former une forme canonique entre les deux électrons (Fig I-2.a). Un grand champ de charge d’espace locale est crée et d’autres avalanches auxiliaires vont apparaître au voisinage de l’anode. Le bout du streamer attire ces avalanches et leurs électrons entrent dans la zone des ions positifs. Cette action forme un canal de plasma qui s’étend de l’anode à la cathode. [Yu-06] Ce canal est appelé le canal de streamer (Fig I-2.b), si le bout du streamer arrive à la cathode le claquage final arrive. (Fig I-2.c). 19 Chapitre 1 Le phénomène du contournement des isolateurs pollués Figure I-2 : Diagramme schématique de la propagation d’un streamer c) La condition de l’autonomie de la décharge : Comme mentionné avant ; une fois le streamer apparaît, la décharge se maintien par photo ionisation créée par la décharge elle même. A partir de ce moment la décharge devient autonome. La formation du streamer est la condition de l’autonomie de la décharge sous un champ uniforme, et elle peut être exprimé comme suit : e αd = k = cons tan te (I-5) Où k est approximativement 108 Pour comparer le mécanisme du streamer et celui de Townsend l’équation (I-5) peut être écrite comme suit : α.d = k = constante (I-6) Il faut noter que cette équation à la même forme que celle de la condition de l’autonomie de la décharge de Townsend équation (I-4) mais k est égale à 18 à 20 pour la formation du streamer qui est plus grande que celle de Townsend. [Yu-06] 20 Chapitre 1 Le phénomène du contournement des isolateurs pollués I.2.4- La décharge surfacique : I.2.4.1- Définition : Lorsque une décharge électrique se produit sur la surface d’un diélectrique par un moyen gazeux ou liquide, cette décharge s’appelle décharge surfacique en outre ; si un claquage électrique se produit le long de l’interface entre le gaz et le liquide ou entre le gaz et le solide, on l’appel contournement. Dans cette étude on va s’intéresser plus particulièrement au phénomène du contournement observé sur la surface d’un isolateur et qui est l’interface entre un gaz et un solide. I.2.4.2- Mécanisme du contournement de la surface : Le contournement surfacique d’un isolateur dans le vide se divise en 3 stades. [Yu-06] Initiation : Le contournement surfacique commence souvent par l’émission d’électrons (généralement par champ ou émission thermique) de la rencontre des trois jonctions, électrodes, isolateur et le gaz. Développement ou croissance : Il y a deux théories principales qui décrivent le développement du contournement. Cascade d’émission électronique secondaire : Quelques électrons initiaux bombardent la surface de l’isolateur et produisent des électrons additionnels et une avalanche d’émission électronique secondaire apparaît. Cascade d’électrons d’une mince couche sur la surface de l’isolateur : Quelques électrons sont injectés à l’intérieur de l’isolateur à la cathode. Une part de ces électrons vont être émis dans le vide les autres vont être accélérés par le champ dans l’isolateur et vont entrer dans des collisions inélastiques. Une cascade d’électrons va être créée le long de la surface (à l’intérieur de l’isolateur) de plus en plus leur énergie dépasse la bande du contour de l’isolateur. Ces deux processus peuvent causer la désorption du gaz qui a été absorbé par la surface de l’isolateur. Stade final : Le gaz absorbé est ionisé. L’existence et le mouvement des ions produits plus loin augmentent le long de la surface de l’isolateur. En fin le contournement de la surface survient. 21 Chapitre 1 Le phénomène du contournement des isolateurs pollués I.3- Contournement des isolateurs pollués : Le contournement des isolateurs pollués est un type du phénomène de contournement causé par le dépôt de pollution sur la surface d’un isolateur. Pour investiguer ce phénomène plusieurs test de contournement ont été fait sous des conditions de pollution naturelles ou artificielle (Stations de pollution ou laboratoires) [Kon-06].La commission internationale d’électrotechnique (CEI) a déterminé les normes internationales de la pollution artificielle pour les tests des isolateurs de la pollution artificielle pour les tests des isolateurs HT [IEC-93] I.3.1- Processus de contournement des surfaces polluées : En général, le processus de contournement des isolateurs pollués peut se diviser en 4 étapes. [Yu-06] a) Dépôt de polluant : Le polluant sous forme de poussière se pose sur la surface de l’isolateur et forme aussi une couche de pollution. b) Humidification de la couche de pollution : La résistance de la couche de pollution est très élevée lorsqu’elle est sèche. Donc la pollution ne cause pas la diminution des propriétés diélectrique de l’isolateur. Cependant, sous quelques conditions climatiques défavorables (brouillard, rosée, … etc) ; la couche de pollution constituée essentiellement de particules solubles, peut être humidifiée et sa conductivité augmente. Il en résulte un courant de fuite qui va circuler à travers la couche de pollution (Fig I-3.a). c) Formation de la bande sèche et apparition de l’arc local : A cause de la forme de l’isolateur, la densité du courant sur la surface est généralement non uniforme [Fla-07]. Dans les régions où la densité du courant est élevée, l’effet thermique sera plus grand et une zone locale sèche apparaît dans cette région. Cette zone à une tendance à s’élargir jusqu’à la formation d’une bande sèche (Fig I-3.b). 22 Chapitre 1 Le phénomène du contournement des isolateurs pollués La bande sèche à une grande résistance, et la tension appliquée sera aux extrêmes de cette bande. Si la tension est suffisamment grande, on aura claquage de cette bande et un arc apparaît le long d’elle. Au voisinage de la racine de ce local, la concentration du courant mène à l’élargissement de la bande sèche (Fig I-3.c) [Kim-07] (c) (e) Figure I-3 : Les stades du contournement d’une surface polluée e)- Développement d’un arc et achèvement du contournement : Selon les conditions, la décharge surfacique évolue par ces différents moyens possibles : L’arc local peut s’éteindre (Fig I-3.d) L’arc local se déplace latéralement pour trouver une position plus stable correspondante à une longueur d’arc plus petite (Fig I-3.e) L’arc local s’étend longitudinalement jusqu’à ce qu’il atteint les électrodes et cause ainsi un contournement complet (Fig I-3.f) I.3.2- Le mécanisme de contournement des isolateurs pollués : a) Les critères du contournement de la pollution : Plusieurs recherches ont proposé certains critères pour le développement de l’arc et le contournement. 23 Chapitre 1 Le phénomène du contournement des isolateurs pollués Le premier critère quantitatif a été proposé par Obenaus [Obe-58] et complété par Neumarker [Kim-07] qui est connu sous le nom de la théorie de l’extinction. Le processus du contournement est modélisé selon un arc en série avec une résistance, qui représente la portion mouillé de la couche de pollution (Fig I-4). Arc Résistance résiduelle HV x L Figure I-4: Modèle physique du développement de l’arc électrique L’équation correspondante à ce circuit peut être exprimée comme suit : (I-7) U= Uarc + IRr Où U est la tension totale entre les électrodes, I est le courant de fuite, Uarc est la tension de l’arc et Rr est la résistance résiduelle de la couche de pollution. La tension de l’arc Uarc peut être exprimée comme suit : U arc AxI n (I-8) Où A et n sont les constantes de l’arc et x est la longueur de l’arc. L’équation (I-7) donne la valeur minimale de U (tension critique (Uc) pour l’extension de l’arc. Donc si la condition suivante est réalisée, l’arc peut s’étendre et le contournement apparaît. U app U c (I-9) Où Uapp est la tension appliquée Alston et Zoledziowski [Als-63] ont donné les valeurs critiques (Uc, Ic, xc) de cette façon : 24 Chapitre 1 Le phénomène du contournement des isolateurs pollués n 1 U A n1 .L.r n 1 p c L xc n 1 1 n 1 Ic A rp (I-10) Où L est la longueur de fuite et rp est la résistance de la pollution par unité de longueur de fuite. Cependant le critère d’extinction d’Obenaus est suffisant pour le contournement. Hampton [Ham-64] et Hesketh [Hes-67] ont établi un critère de développement de l’arc : di 0 dx (I-11) Si ce critère est accompli pour toutes les positions le long du chemin de l’arc, le contournement peut surgir. Näcke [Kim-07] a proposé un critère de stabilité électrique. Le changement de la tension totale avec le déplacement de la racine de la décharge dans ce critère. Il est représenté par la relation suivante : R U dx du arc dx i x p x i p i (I-12) Où x est la longueur de l’arc et xp est la longueur de la couche de pollution. L’arc se déplace si du 0 . Sous la tension alternative il y a trois modèles pour le ré-allumage de l’arc après le zéro du courant. - Le modèle de ré-allumage énergétique. Dans ce modèle le claquage apparaît lorsque la longueur de l’arc résiduel est insuffisante pour dissiper l’énergie injectée. Ce critère est donné par : U cx2 kN 02 Rm x (I-13) Où Ucx est la tension critique qui correspond à la longueur x de l’arc, N02 est la constante post-zéro des caractéristiques de l’arc, Rm est la résistance de l’arc résiduel au pic du courant et k est la diffusivité thermique. 25 Chapitre 1 Le phénomène du contournement des isolateurs pollués - Modèle du ré-allumage diélectrique. Le claquage du diélectrique arrive lorsque la valeur instantanée de la tension de rétablissement dépasse la force diélectrique de la distance entre les électrodes, et elle est typique pour la vitesse faible de la tension de rétablissement. La condition critique pour le claquage du diélectrique est donnée par [Riz-81] : U cx xEda f ( I m ) (I-14) Où Eda est la rigidité diélectrique à la température ambiante. - Modèle à base expérimentale. En mettant un arc en série avec la résistance d’une pollution uniforme, la tension de contournement minimale peut être obtenue par [Riz-81] Uc 23rp0, 4 L (I-15) Ce modèle est basé exclusivement sur les résultats expérimentaux. Un seul modèle montre la relation entre la tension minimale de ré-allumage de l’arc, la plus basse tension pour laquelle le rallumage de l’arc AC suit le passage du courant par zéro, et le courant de l’arc. Ce modèle peut être représenté comme suit : U cx 800 x I (I-16) Où I est le courant de l’arc. b) Le mécanisme physique interprétant le développement de l’arc et le contournement : Le dernier critère de contournement ne considère aucun processus physique dans le contournement de la pollution. Le processus physique inclus les forces externes qui traînent la décharge à travers la surface. Ces forces externes sont l’attraction électrostatique, les forces électromagnétiques, les forces thermiques. Flazi [Fla-87] a du se ramener à une approche plus globale du phénomène, à savoir le mécanisme de la propagation par ionisation progressive. Ainsi il a déduit que l’augmentation du degré d’ionisation de la décharge et le démarrage des processus 26 Chapitre 1 Le phénomène du contournement des isolateurs pollués d’ionisation devant elle, sont les facteurs responsables de l’allongement et du changement que subit la décharge, dans ses aspects et ses états dynamiques. Jolly [Jol-72] a déduit que les forces, qui influent sur la racine de l’arc, sont de l’ordre de 2,8.10 6 N pour la force électrostatique, 1,6.10 10 N pour la force magnétique et de 1,3.10 7 N pour la force thermique. Tel que les petites forces n’agissent pas sur une vitesse de développement de l’arc de l’ordre de 10 2 10 3 durant le processus de contournement. Par contre il a proposé que le contournement de la pollution est un processus de claquage électrique. La convergence du flux des lignes de courant à la racine de l’arc produit un champ électrique local intense, qui accélère la collision des électrons et ionise l’air au voisinage de la tête de l’arc, ce qui fait que l’arc s’étend. L’ionisation thermique et photo électrique augmentent le processus d’ionisation. Mercure et al [Mer-82] ont mesuré la distribution du courant à la racine de l’arc durant le contournement et ont proposé qu’une grande densité de courant et la température de l’arc à l’avant de l’arc résulte du mouvement apparent de la racine de l’arc ce qui a comme conséquence l’élongation de l’arc sur la surface de l’électrolyte. Li [Li-88] et Zhang [Zha-91] on calculé séparément l’intensité du champ électrique à la racine de l’arc. Li l’a trouvé très petite pour causer le claquage électrique de l’air et a proposé que le contournement peut être causé par l’ionisation thermique du sel due aux températures élevées. Zhang a conclu que le facteur principal qui fait que l’arc se propage à l’avant c’est l’ionisation thermique de l’air et la composante normale de la force du champ joue un rôle important dans l’augmentation de la température résultante et la formation de l’ionisation thermique. Lorsque la longueur de l’arc atteint environ 90% de la longueur de fuite, le champ électrique à la racine de l’arc est assez élevé pour le claquage électrique de l’air, ce qui mène au contournement final de l’isolateur pollué. c) La vitesse de propagation de l’arc : Différents types d’ionisation peuvent mener à de différentes vitesses de propagation de l’arc. Alors, les recherches sur le mécanisme du développement de l’arc et du contournement doivent prendre en considération la vitesse de propagation de l’arc. 27 Chapitre 1 Le phénomène du contournement des isolateurs pollués En utilisant une caméra ultra-rapide Al Baghdadi [Bag-70] a obtenu cette formule empirique pour la vitesse de l’arc sous D.C. v 1,54.10 4 rp (i 4 ic4 )cm / s (I-17) Où v est la vitesse de l’arc, i est le courant de l’arc ic est le courant critique, et rp est la résistance de la pollution par unité de longueur. En supposant que l’énergie nécessaire pour la création d’un nouvel arc vient de la baisse de la tension de l’électrode sur la surface de l’eau. Jolly et al [Jol-74] a déduit que U U ei Q (I-18) Où Ue est la baisse de la tension de l’électrode et Q est l’énergie contenue par unité de longueur de l’arc. Zoldziowski [Zol-66] a trouvé que les caractéristiques de la durée de l’intensité du C.A. des isolateurs pollués, est exprimée : (U 2 U c2 )t cons tan te.Rr2 (I-19) Où Uc est la constante (tension critique) et Rr est la résistance de la pollution de l’isolateur. Après quelques suppositions et déduction [Riz-81] l’équation (I-19) peut être écrite comme suit : (U 2 U c2 )t Q 2 3 .Rr .L 3 (I-20) Où σ est la conductance constante à la queue de la décharge. Rizk [Riz-81] a supposé que les variables qui influent sur la vitesse de l’arc, sont les constantes de l’arc A et n, la constante du temps de l’arc θ, les paramètres de l’isolateurs (xp, L, r). Le circuit donné fait inclure U, la fréquence angulaire ω et l’inductance Ls. En utilisant une méthode d’analyse dimensionnelle des résultats expérimentaux d’Al Baghdadi [Bag-70] la vitesse de l’arc v est obtenue de la relation suivante : 4, 5 v const . i 4 . r p1 n (I-21) 28 Chapitre 1 Le phénomène du contournement des isolateurs pollués Où i est le courant de l’arc et rp est la résistance de la pollution par unité de longueur de fuite. I.3.3- Paramètres d’influence : I.3.3.1- Influence de la longueur de la ligne de fuite : La mise en évidence de l’influence de la longueur de la ligne de fuite expérimentalement est un peu difficile à cause de la longueur de la chaine et la limite des laboratoires. (a) (b) (c) Figure I-5: Résultats expérimentaux, obtenus sur trois types d’isolateurs avec différentes solutions polluantes, de la tension de décharge disruptive en fonction de la longueur des chaînes. (a) et (b) : verre trempé. (c): céramique Mais comme le montre la figure (I-5) [Roy-84] la majorité des résultats confirme la linéarité de la tenue sous pollution de la tension de contournement par unité de longueur de la ligne de fuite. I.3.3.2- Influence du diamètre : Si on assimile l’isolateur réel à un isolateur cylindrique qui a la même ligne de fuite L et la même résistance de la couche polluante e, on peut dire que le diamètre 29 Chapitre 1 Le phénomène du contournement des isolateurs pollués moyen du premier est aussi assimilable au deuxième.(Fig I.6) [Cha-03] D D Figure I-6: Assimilation théorique d'un isolateur a un cylindre Si on adopte l’assimilation de la figure I-6, on peut écrire : S LD (I-22) Où S est la surface latérale du cylindre, D est le diamètre, et L est la longueur du cylindre. Par conséquence, si on intègre D le long du profil de l'isolateur, on aura une approximation de son facteur de forme : L ds D 0 f (I-23) Où ds est l'abscisse curviligne d'un point de l'isolateur mesuré le long de son profil. Or, si on assimile la couche polluante a un film régulier d'épaisseur e et de résistivité volumique ρ, la résistance de l'isolateur sera: ds f D e e 0 L R (I-24) Donc,on peut dire que la résistance du cylindre équivalent est R L D e (I-25) En conclusion, en assimilant l'isolateur réel a un isolateur cylindrique (Fig I.6) ayant une même ligne de fuite LF et une même couche polluante, le diamètre moyen s'écrit : 30 Chapitre 1 Le phénomène du contournement des isolateurs pollués D LF f (I-26) Pour les isolateurs de gros diamètre, on peut résumer le diamètre moyen comme suit: Dx D f De 2 Dm 2 D f De1 De 2 4 D De De Df De Figure I-7: Diamètre moyen des isolateurs IÉEE et EPDM Pour une certaine densité de contamination, la tension critique de contournement diminue au fur et à mesure que le diamètre augmente et ce, jusqu'à une certaine valeur où la tension de contournement cesse de diminuer. Ce phénomène s'explique par le fait qu'un large diamètre D signifie une plus grande exposition de la surface à la pollution, diminuant ainsi la résistance (d'après (I-25)) et réduisant par conséquent la tension de contournement. De plus, l'augmentation du diamètre peut impliquer l'augmentation de la distance de fuite qui atténue la diminution de la tension de contournement. La figure (I-8) exprime les résultats d'essais par le rapport entre la tension de 31 Chapitre 1 Le phénomène du contournement des isolateurs pollués contournement mesurée (Uc) et la tension de contournement moyenne des isolateurs de petit diamètre (Uc*).[Roy-84] Figure I-8: Performance des isolateurs pollues en fonction du diamètre moyen Les expériences ont démontré que la variation du diamètre influence sur la densité du dépôt de contamination sur l'isolateur : plus le diamètre augmente, plus la densité du dépôt contaminant diminue (Fig I-9). Figure I-9 : La DDSE en fonction du diamètre moyen 32 Chapitre 1 Le phénomène du contournement des isolateurs pollués I.3.3.3- Influence de la forme de l’isolateur : (a) (b ) Figure I-10: Influence du profil sur le mécanisme de contournement D’après la linéarité entre la tension de contournement et la ligne de fuite mise en évidence dans (§ I-3), on peut dire que l’isolateur de la figure (I-10.b) est meilleur que celui de la figure (I-10.a). Mais cette hypothèse n’est vraie que si l’arc qui se développe reste au contact de la surface de l’isolateur, et ça ce n’est pas toujours vérifié car il est possible que l’arc adopte un trajet plus court comme le montre la figure (I-10.b) et par conséquence on ne peut pas déterminer exactement l’itinéraire que doit suivre l’arc. On a été amené à chercher un critère empirique appelé facteur de profil [Roy-84] (a) (b) Figure I-11 : Définition du facteur de profil Pour la figure (I-11.a) on a : (I-27) Et pour les isolateurs cap-pin (Fig I-11.b): (I-28) L’influence du profil sur la tension de contournement est donnée par la courbe de la figure suivante [Roy-84]: 33 Chapitre 1 Le phénomène du contournement des isolateurs pollués Figure I-12: Influence du profil sur la tension de contournement des isolateurs I.3.3.4- Influence de la DDSE (Densité de Dépôt en Sels Equivalente) D’après les courbes de la figure (I-13), tracées à partir de données expérimentales, On constate que la DDSE influe directement sur la tension de contournement où plus le degré de pollution est important plus le risque de contournement augmente. [Sla-02] Figure I-13: Variation de la tension de contournement en fonction de la DDSE a) Isolateur AF12 b) Isolateur AD12 34 Chapitre 1 Le phénomène du contournement des isolateurs pollués (e) (f) Figure I-14 : Valeurs de la DDSE durant toute la saison dans différentes zones a) Zones résiduelles c) Zones agriculturales e) Zones côtières b) Zones montagneuses d) Zones au voisinage des routes f) Zones industrielles Il est clair que le degré de pollution joue un rôle majeur dans le phénomène de contournement des isolateurs HT, et par conséquent il doit être prit en considération lors du dimensionnement de ces équipements. Or le degré de pollution diffère beaucoup d’une région à une autre et d’une période de l’année à une autre période [Sah-10], comme le montre cette étude faite en Chine entre l’année 2006 et l’année 2007 (Fig I-14). [Wan-08] 35 Chapitre 1 Le phénomène du contournement des isolateurs pollués Donc pour le bon dimensionnement des isolateurs il faut passer par plusieurs tests, ce qui est coûteux du point de vue économique et prend beaucoup de temps. Ainsi il faut trouver d’autres solutions plus rapides et moins chères. I.4- Conclusion : Le contournement des isolateurs est le problème principal à l’origine des défaillances qui affectent les réseaux de transport de l’énergie électrique. D’autre part il y a plusieurs facteurs qui influencent sur le bon fonctionnement de l’isolateur, et on a vu dans ce chapitre que parmi ces facteurs la pollution est reconnue comme étant le facteur majeur à l’origine du contournement. Nous avons présenté un model mathématique visant à prédire le comportement des isolateurs pollués, mais il reste encore plusieurs aspects à explorer pour établir des liens entre les multiples facteurs intervenant dans le mécanisme du contournement. Ainsi le but du travail qui suit, est la mise en place ou l’amélioration d’outils numériques, pour la prédiction des tensions critiques de contournement. 36 Chapitre II Algorithmes génétiques Chapitre II Algorithmes génétiques II.1- Introduction : Dans les années 1960, John Holland étudie les systèmes évolutifs et, en 1975, il introduit le premier modèle formel des algorithmes génétiques (the canonical genetic algorithm AGC) dans son livre « Adaptation in Natural and Artificial Systems » [Hol-75]. II expliqua comment ajouter de l'intelligence dans un programme informatique avec les croisements (échangeant le matériel génétique) et la mutation (source de la diversité génétique). Ce modèle servira de base aux recherches ultérieures et sera plus particulièrement reprit par Goldberg qui publiera en 1989, un ouvrage- de vulgarisation des algorithmes génétiques, et ajouta à la théorie des algorithmes génétiques les idées suivantes Un individu est lie à un environnement par son code d'ADN. Une solution est liée à un problème par son indice de qualité. Genèse t=t+1 Evaluation Sélection Opérateurs (croisements ; Mutations …..) Non Terminé ? Oui Résultat Figure II-1 : Organigramme d'un algorithme évolutionnaire. 38 Chapitre II Algorithmes génétiques II.2- Algorithmes évolutionnaires : Ci-dessus est présenté l'organigramme d'un algorithme évolutionnaire. II s'agit de simuler l'évolution d'une population d'individus divers (généralement tirée aléatoirement au départ) à laquelle on applique différents opérateurs (recombinaisons, mutations...) et on soumet chaque génération à une sélection. Si la sélection s'opère à partir de la fonction d'adaptation, alors la population tend à s'améliorer [Bac-96]. Un tel algorithme ne nécessite aucune connaissance du problème : on peut représenter celuici par une boite noire comportant des entrées (les variables) et des sorties (les fonctions objectives). L'algorithme ne fait que manipuler les entrées, lire les sorties, manipuler à nouveau les entrées de façon à améliorer les sorties,….. etc. [Whi-93] Les algorithmes évolutionnaires constituent une approche originale : il ne s'agit pas de trouver une solution analytique exacte, ou une bonne approximation numérique, mais de trouver des solutions satisfaisantes au mieux à des différents critères, souvent contradictoires. Même s'ils ne permettent pas de trouver à coup-sûr la solution optimale de l'espace de recherche, du moins on peut constater que les solutions fournies sont généralement meilleures que celles obtenues par des méthodes plus classiques, pour un même temps de calcul. La modélisation, s'ajoutant à l'observation, à la théorie et à l'expérience, est un nouvel outil scientifique qui s'est fait valoir depuis l'avènement de l'informatique. Celle-ci peut contribuer à la biologie théorique en la plaçant dans un contexte plus vaste. L'objectif est double: d'une part, la modélisation de ces phénomènes permet de mieux les comprendre, et ainsi mettre en évidence les mécanismes qui sont à l'origine de la vie ; d'autre part, on peut exploiter ces phénomènes de façon libre et peuvent donc être diverses. Le domaine de l'évolution artificielle n'a connu une réelle expansion qu'a partir des 15 dernières années. Pourtant, l'idée de simuler sur ordinateurs des phénomènes évolutionnaires remonte aux années 50. Des concepts tels que la représentation des chromosomes par des chaînes binaires étaient déjà présents. 39 Chapitre II Algorithmes génétiques L'essor de l'évolution artificielle, depuis les années 80, peut s'expliquer par deux phénomènes concurrents. Premièrement, cet essor est principalement dû à l'accroissement exponentiel des moyens de calculs mis à la disposition des chercheurs, ce qui leur a permet d’obtenir des résultats expérimentaux pertinents et prometteurs. Le deuxième point est l'abandon du biologiquement plausible. Trois types d'algorithmes évolutionnaires ont été développés isolément et à peu près simultanément, par différents scientifiques : la programmation évolutionniste [Fog66], les Stratégies d'évolution [Rec-65] et les Algorithmes Génétiques [Hol-75]. II.3- Algorithmes génétiques : Nous traiterons seulement ici les algorithmes génétiques fondés sur le NeoDarwinisme, c'est-à-dire l'union de la théorie de l'évolution et de la génétique moderne. Ils s'appuient sur différentes techniques dérivées de cette dernière: croisements, mutation, sélection... Un algorithme génétique recherche le ou les extrema d'une fonction définie sur un espace de données. Pour l'utiliser, on doit disposer des cinq éléments suivants: 1)- Un principe de codage de l'élément de population. Cette étape associe a chaque point de l'espace d'état une structure de données. Elle se place généralement après une phase de modélisation mathématique du problème traité. La qualité du codage des données conditionne le succès des algorithmes génétiques. Les codages binaires ont été très utilisés à l'origine. Les codages réels sont désormais largement utilisés, notamment dans les domaines applicatifs pour l'optimisation de problèmes à variables réelles. 2)- Un mécanisme de génération de la population initiale. Ce mécanisme doit être capable de produire une population d'individus non homogène qui servira de base pour les générations futures. Le choix de la population initiale est important car il peut rendre plus ou moins rapide la convergence vers l'optimum global. Dans le cas où l'on ne connaît rien du problème à résoudre, il est essentiel que la population initiale soit repartie sur tout le domaine de recherche. 3)- Une fonction à optimiser. Celle-ci retourne une valeur appelée fitness ou fonction d'évaluation de l'individu. 4)- Des opérateurs permettant de diversifier la population au cours des générations et d'explorer l'espace d'état. L'opérateur de croisement recompose les gènes 40 Chapitre II Algorithmes génétiques d'individus existant dans la population, l'opérateur de mutation a pour but de garantir l'exploration de l'espace d'états. 5)- Des paramètres de dimensionnement: Taille de la population, nombre total de générations ou critère d'arrêt, probabilités d'application des opérateurs de croisement et de mutation. Nous savons maintenant sur quoi se basent les algorithmes génétiques. Il est désormais temps d'approfondir les mécanismes de sélection de population et la notion de diversité qui en découle. Nous tacherons également à définir les opérateurs évoqués dans l'organigramme de l'algorithme évolutionnaire (Fig.II-1), et à donner une image à la fois globale et précise des outils principaux des algorithmes génétiques. II.3.1- Théorie des algorithmes génétiques AG : Comme dans la nature où les êtres se reproduisent, dans le modèle des algorithmes génétiques, les spécimens se reproduiront aussi; en particulier ceux jugés les plus forts se reproduiront a un rythme plus rapide. Des opérateurs génétiques seront appliqués sur des candidats en espérant engendrer ainsi de nouveaux candidats plus performants. En biologie, on manipule des gènes et des chromosomes; il en va de même dans le modèle des AG, les problèmes et les solutions seront encodées. L'encodage prend souvent la forme d'une chaîne de bits. Ces chaînes de bits sont comparables aux chromosomes des systèmes biologiques, tandis que les bits ou caractères qui composent ces chaînes sont comparables aux gènes. L'ensemble de ces chaînes forme une population, alors qu'en biologie on parle de génotype. II.3.2- Principe de fonctionnement des algorithmes génétiques AG : Les algorithmes génétiques fournissent des solutions aux problèmes n'ayant pas de solutions calculables en temps raisonnable de façon analytique ou algorithmique. Selon cette méthode, des milliers de solutions (génotypes) plus ou moins bonnes sont créées au hasard puis sont soumises à un procédé d'évaluation de la pertinence de la solution simulant l'évolution des espèces : les plus "adaptes", c'est-à-dire les solutions au problème qui sont les plus optimales survivent davantage que celles qui le sont moins et la population évolue par générations successives en croisant les 41 Chapitre II Algorithmes génétiques meilleures solutions entre elles et en les faisant muter, puis en relançant ce procédé un certain nombre de fois afin d'essayer de tendre vers la solution optimale. (Fig.II-2). Population initiale Evaluation Reproduction Sélection Croisement Reproduction/Elitism Population suivante Mutation Evaluation No Critère Oui Individu Solution Figure II-2: Schéma du principe des algorithmes génétiques La figure (II-3) illustre la structure d'un algorithme génétique canonique: 1. Initialiser la population initiale P(O) aléatoirement et mettre i = 0; 2. REPETER (a) Evaluer la fitness pour chaque individu dans P(i); (b) Sélection des Parents dans P(i) par le calcul de leur fitness ; (c) Appliquer l'operateur de croisement sur P(i) pour sélectionner les parents; (d) Appliquer l'operateur de mutation pour reproduire de nouveaux individus; (e) Remplacer les Anciens de P par leurs Descendants (progéniture) pour la création de la génération P(i +1); 3. jusqu'à un critère d'arrêt satisfaisant. Figure II-3 : algorithme génétique canonique 42 Chapitre II Algorithmes génétiques Le critère d'arrêt peut être de natures diverses, par exemple : Un taux minimum qu'on désire atteindre d'adaptation de la population au problème, Un certain temps de calcul à ne pas dépasser, Un certain nombre de générations à ne pas dépasser, Une combinaison de ces trois points. Cela en fait donc un modèle minimal et canonique pour n'importe quel système évolutionnaire et pour n'importe quel problème pouvant être abordé sous cet angle, sous ce paradigme. En effet, l'utilisation des algorithmes génétiques, ne requiert pas la connaissance de la nature du problème, il est seulement nécessaire de fournir une fonction permettant de coder une solution sous forme de gènes (et donc de faire le travail inverse) ainsi que de fournir une fonction permettant d'évaluer la pertinence d'une solution au problème donné. II.3.3- Les caractéristiques des algorithmes génétiques : Les algorithmes génétiques se caractérisent par quatre aspects : le codage des paramètres du problème, l'espace de recherche, la fonction d'évaluation servant à sélectionner les chromosomes parents, et le hasard qui joue un rôle important dans l'évolution des chromosomes de génération en génération. Nous allons passer en revue ces différents aspects. II.3.3.1- Codage : Chaque paramètre d'une solution est assimilé à un gène, toutes les valeurs qu'il peut prendre sont les allèles de ce gène, on doit trouver une manière de coder chaque allèle différent de façon unique (établir une bijection entre l'allèle "réel" et sa représentation codée). Un chromosome est une suite de gènes, on peut par exemple choisir de regrouper les paramètres similaires dans un même chromosome (chromosome à un seul brin) et chaque gène sera repérable par sa position. Chaque individu est représenté par un ensemble de chromosomes, et une population est un ensemble d'individus. 43 Chapitre II Algorithmes génétiques Figure II-4:Les cinq niveaux d'organisation d'un algorithme génétique Il y a trois principaux types de codage utilisables, et on peut passer de l'un à l'autre facilement : Le codage binaire : c'est le plus utilisé. Chaque gêne dispose du même alphabet binaire {0,1}. Si un gène est représenté par un entier long (32 bits), les chromosomes qui sont des suites de gènes sont représentés par des tableaux de gènes et les individus de notre espace de recherche sont représentés par des tableaux de chromosomes. Le codage réel : les nombres binaires étant pour nous moins évocateurs que les nombres réels, des difficultés surviennent pour exprimer la fonction objective et traiter les problèmes à plusieurs variables. En outre, les opérations de conversion des solutions potentielles (réelles) en chaînes de bits et des solutions obtenues en une forme réelle facilitant leur interprétation sont coûteuses en temps-machine. De plus, elles sont répétées un grand nombre de fois a chaque génération. La représentation réelle propose un compromis intéressant : elle élimine toutes les opérations de conversion, mais en contrepartie elle rend les algorithmes gétiques plus dépendants des problèmes. 44 Chapitre II Algorithmes génétiques Gène 1 Gène 2 Gène 3 1001001 11101011 00011010 Figure II-5: Illustration schématique du codage des variables réelles Le codage de Gray : dans le cas d'un codage binaire on utilise souvent la "distance de Hamming" comme mesure de la dis similarité entre deux éléments de population, cette mesure compte les différences de bits de même rang de ces deux séquences. Et c'est la que le codage binaire commence à montrer ses limites. En effet, deux éléments voisins en terme de distance de Hamming ne codent pas nécessairement deux éléments proches dans l'espace de recherche. Cet inconvénient peut être évité en utilisant un "codage de Gray" : le codage de Gray est un codage qui a comme propriété qu’entre un élément n et un élément n+l, donc voisin dans l'espace de recherche, un seul bit diffère. II existe deux types de difficultés dans le choix d'un codage. D'une part celui-ci doit pouvoir être adapté au problème de façon à limiter au mieux la taille de l'espace de recherche, et aussi de façon que les nouveaux chromosomes engendrés par les opérateurs de recherche soient significatifs le plus souvent possible, c'est-à-dire qu'ils puissent coder des solutions valides respectant les contraintes du problème. II.3.3.2- Espace de recherche des solutions : La plupart des méthodes d'optimisation effectuent une recherche point par point. Les règles de transition d'un point à un autre sont souvent déterministes et la solution trouvée est souvent un optimum local au lieu d'être un optimum global. Les AG, effectuent la recherche à partir d'une population de chaînes générées aléatoirement. Dans cette population, on retrouvera à la fois des candidats très performants et d'autres qui le sont moins. Le parallélisme induit est un avantage évident car l'approche de la recherche à partir d'une population peut être perçue comme une recherche locale dans 45 Chapitre II Algorithmes génétiques un sens généralisé. Ce n'est pas le voisinage d'une seule solution qui est explorée, mais le voisinage de toute la population; ce qui ne devrait pas être assimile à une simple union des voisinages individuels [Pir-96]. Ainsi donc, une population initiale diversifiée offre plus de chances de bien cerner la recherche et de mieux se rapprocher de la solution optimale, sinon on risque d'obtenir des espèces dégénérées et la probabilité de converger vers un minimum global est ainsi fortement réduite. II.3.3.3- Fonction d'évaluation (fitness) et le hasard : Contrairement à un bon nombre de méthodes qui requièrent beaucoup d'informations pour pouvoir fonctionner efficacement, les AG nécessitent peu d'informations : ils fonctionnent essentiellement de manière aveugle. Pour effectuer une recherche de solutions meilleures, ils n'ont besoin que des valeurs des fonctions objectives associées aux chaînes individuelles. Ces valeurs ont pour but d'évaluer si un individu est mieux adapté qu'un autre a son environnement. Ce qui signifie qu'elle quantifie la réponse fournie au problème pour une solution potentielle donnée. Ainsi les individus peuvent êtres comparés entre eux [Voi-04]. Les individus déterminés par la fonction objective (fitness) vont servir au processus de sélection des candidats aptes à la reproduction et au processus de survie des espèces. Cette fonction, propre au problème, est souvent simple à formuler lorsqu'il y a peu de paramètres. Au contraire, lorsqu'il y a beaucoup de paramètres ou lorsqu'ils sont corrélés, elle est plus difficile à définir. Dans ce cas, la fonction devient une somme pondérée de plusieurs fonctions. Un ajustement des coefficients est alors nécessaire. Par ailleurs, les AG utilisent des règles de transition probabilistes plutôt que déterministes pour guider leur recherche. Le choix des chromosomes à perturber est réalisé de façon probabiliste. Dans le processus de croisement, le lieu de croisement est choisi aléatoirement à l'intérieur du chromosome. De même, le gène devant subir une mutation à l'intérieur d'un chromosome est choisi selon une certaine probabilité. Le hasard occupe donc une place importante dans le fonctionnement des AG. 46 Chapitre II Algorithmes génétiques II.3.4- Opérateurs génétiques : Trois mécanismes composent essentiellement les opérateurs génétiques : la sélection, le croisement et la mutation. Ces opérateurs se retrouvent dans la littérature sous plusieurs variantes. II.3.4.1- Opérateur de sélection : Cet opérateur est chargé de définir quels seront les individus de P qui vont être dupliqués dans la nouvelle population P+1 et vont servir de parents (application de l'opérateur de croisement). Cet opérateur est peut-être le plus important puisqu'il permet aux individus d'une population de survivre, de se reproduire ou de mourir. En règle générale, la probabilité de survie d'un individu sera directement liée à son efficacité relative au sein de la population. On trouve essentiellement quatre types de méthodes de sélection différentes : La sélection uniforme: Cette méthode est la plus simple consiste à sélectionner les Npop individus de 1 jusqu'à Npop deux par deux afin de former le couple (mère-père). Ainsi, cet algorithme de sélection arrange des rangs impairs avec des rangs pairs de la matrice de population. La mère est désignée par les individus des rangés impaires ma= I ndl, I nd3, I nd5,... et le père est désigné par les individus des rangés paires pa= I nd2, I nd4, I nd6... Cette méthode semble être très peu utilisée et en plus elle possède une variance faible, donc introduit une grande diversité. La sélection stochastique: Cette approche utilise un générateur uniforme de nombre aléatoire pour choisir les individus qui vont servir de parents. Les nombres de rangée de parents sont localisés par : ma = cei1(Nsel * rand( 1,N sel)) pa = cei1(NSel * rand( 1,N sel)) où : cei1:est une fonction Matlab (arrondit la valeur au prochain nombre entier supérieur). Nsel,: Nombre d'individus sélectionnés La méthode de la "loterie biaisée" (roulette whell weighting) de GoIdBerg: Cette méthode est la plus connue et la plus utilisée. Avec cette méthode, chaque individu à une probabilité, d'être sélectionné, proportionnelle à sa performance, donc plus les individus sont adaptés au problème, plus ils ont de chances d'être sélectionnés. La 47 Chapitre II Algorithmes génétiques probabilité d'être choisie est directement liée à la valeur d'aptitude du parent, elle est inversement proportionnel a leur aptitude. Le chromosome avec une petite aptitude a une grande probabilité et vice-versa. L'aptitude du rang : Cette approche est indépendante du problème à résoudre, et calcule la probabilité (Pn) a partir du rang des chromosomes (n) [Hau-04]: Pn N sel n 1 N sel n n 1 (II.1) La population de petite taille a une grande probabilité de sélectionner le même chromosome. L'avantage de cette approche est que les probabilités ne change plus a chaque génération. L'aptitude du fitness : La probabilité de la sélection est calculée à partir de la valeur de fitness du chromosome dans la population. La valeur de fitness normalisée pour chaque chromosome est calculée par [Hau-04]: Fn f n f N sel 1 (II.2) Où : Fn est la valeur de fitness normalisée, fn est la valeur de fitness de l'individu et f N sel 1 est la petite valeur de fitness des chromosomes jetés. La probabilité (Pn) est calculée par [Hau-04]: Pn F n N sel m Fm (II.3) Où: m est le numéro d'individu Les probabilités doivent être recalculées à chaque génération. Comme la montre la figure (II-6), La roue est divisée en autant de secteurs que d'individus dans la population. La taille de ces secteurs est proportionnelle à l'adaptation de chaque individu (la probabilité d'être choisie). En faisant tourner la roue, l'individu pointé à l'arrêt de la boule est sélectionné. Les individus les mieux adaptés ont donc plus de chance d'êtres tirés au sort lors du déroulement du jeu [Hau-04]. 48 Chapitre II Algorithmes génétiques Figure II-6: La roulette La méthode élitiste: Cette méthode consiste à sélectionner les n individus dont on a besoin pour la nouvelle génération P+l en prenant les n meilleurs individus de la population P après l'avoir triée de manière décroissante selon la fitness de ses individus. Il est inutile de préciser que cette méthode est encore pire que celle de la loterie biaisée dans le sens ou elle amènera a une convergence prématurée encore plus rapidement et surtout de manière encore plus sûre que la méthode de sélection de la loterie biaisée; en effet, la pression de la sélection est trop forte, la variance est nulle et la diversité est inexistante, du moins le peu de diversité qu'il pourrait y avoir ne résultera pas de la sélection mais plutôt du croisement et des mutations. selection par tournois Cette méthode est celle avec laquelle on obtient les résultats les plus satisfaisants. Le principe de cette méthode s'effectue par un tirage avec une remise de deux individus de P, et on les fait "combattre". Celui qui a la meilleure fitness, sa probabilité Pn comprise entre 0.5 et 1. On répète ce processus n fois de manière à obtenir les n individus de P+1 qui serviront de parents. La variance de cette méthode est élevée et le fait d'augmenter ou de diminuer la valeur de P permet respectivement de diminuer ou d'augmenter la pression de la sélection. II.3.4.2- Opérateur de croisement ou Crossover : Le croisement est le processus selon lequel les bits de deux chaînes sélectionnées sont inter changées : dans le langage génétique, on dira que ces chaînes 49 Chapitre II Algorithmes génétiques sont croisées. Son rôle fondamental est de permettre la recombinaison des informations présentées dans le patrimoine génétique de la population. Cet opérateur est applique après avoir applique l'opérateur de sélection sur la population P; on se retrouve donc avec une population P+1 de n/2 individus et on doit doubler ce nombre pour que notre nouvelle génération soit complète. On va donc créer de manière aléatoire n/4 couples et on les fait se "reproduire". Les chromosomes (ensembles de paramètres) des parents sont alors copiés et recombinés de façon à former deux descendants (enfants) possédant des caractéristiques issues des deux parents. Pour exécuter le croisement, des chaînes de la population sont accouplées au hasard. Chaque paire de longueur I subit le croisement comme suit : Les positions entières km appelés points de croisement sont choisies au hasard entre 1 et (I-1). Chaque chromosome se retrouve donc séparé en "segments". Puis chaque segment du parent 1 est échangé avec son "homologue" du parent 2 selon une probabilité de croisement PC. De ce processus résulte deux fils pour chaque couple et notre population P+1 contient donc bien maintenant n individus. En effet, plus le nombre de points de croisements sera grand et plus la probabilité de croisement sera élevée plus il y aura d'échange de segments, donc d'échange de paramètres, et viceversa. Les schémas ci-dessous, illustrent : un croisement en un point (Fig II-7), un autre pour un croisement en deux points (Fig II-8), 2 parents 2 enfants 1 0 0 1 0 0 1 1 1 0 1 0 0 1 1 0 0 1 0 1 0 0 1 0 1 1 0 1 0 1 1 1 0 1 0 0 1 0 1 1 0 1 0 1 1 1 0 0 1 1 1 0 1 0 0 1 Figure II-7: Croisement avec un point de Crossover 50 Chapitre II Algorithmes génétiques 2 parents 2 enfants 1 0 0 1 0 0 1 1 1 0 1 0 0 1 1 0 0 1 0 1 0 0 1 0 1 1 0 1 0 1 1 1 0 1 0 0 1 0 1 1 0 1 0 1 1 1 0 0 1 1 1 0 1 0 0 1 Figure II-8 : Croisement avec 2 points de Crossover On peut citer aussi une autre méthode très utilisée dans le cas des problèmes modélisés par un codage binaire, il s'agit du croisement uniforme. La mise en œuvre de ce procédé est fort simple, elle consiste à définir de manière aléatoire un "masque", c'est-à-dire une chaîne de bits de même longueur que les chromosomes des parents sur lesquels il sera appliqué. Ce masque est destiné à savoir, pour chaque locus, de quel parent le premier fils devra hériter du gène s'y trouvant; si l'un des locus de masque présente un 0, le fils héritera le gène s'y trouvant du parent n° 1, si il présente un 1 il en héritera du parent n° 2. La création du fils n° 2 se fait de manière symétrique. Le schéma représentant le croisement uniforme est donné dans la figure (II-9). Figure II-9 : Croisement uniforme Les nouvelles chaînes peuvent être totalement différentes de leurs parents. Il faut toutefois remarquer que le croisement n'aura aucun effet sur un gène dont les 51 Chapitre II Algorithmes génétiques parents ont la même valeur à la même position. II.3.4.3- Opérateur de mutation : La mutation est le processus selon lequel la valeur d'un gène choisi au hasard dans un chromosome est régénérée (Fig II-10). C'est un processus qui ne survient qu'occasionnellement dans un algorithme génétique avec une probabilité Pm très faible. Une mutation consiste simplement en l'inversion d'un bit (ou de plusieurs bits, mais vu la probabilité de mutation c'est extrêmement rare) se trouvant en un locus bien particulier et lui aussi déterminé de manière aléatoire. 1 0 0 1 0 1 0 0 1 0 1 1 0 1 Une mutation 1 0 0 1 0 1 0 1 1 0 1 1 0 1 Figure II-10: Une mutation L'opérateur de mutation modifie donc de manière complètement aléatoire les caractéristiques d'une solution, ce qui permet d'introduire et de maintenir la diversité au sein de notre population de solutions. Cet opérateur joue le rôle d'un "élément perturbateur", il introduit du "bruit" au sein de la population. En effet, une mutation pouvant intervenir de manière aléatoire au niveau de n'importe quel locus, on a la certitude mathématique que n'importe quel permutation de notre chaîne de bits peut apparaître au sein de la population et donc que tout point de 1'espace de recherche peut être atteint. On notera que la mutation règle donc le problème exposé après le croisement. 52 Chapitre II Algorithmes génétiques II.3.4.4- Opérateur de remplacement : Cet opérateur est le plus simple, son travail consiste à réintroduire les descendants (enfants) obtenus par application successive des opérateurs de sélection, de croisement et de mutation (la population P+1) dans la population de leurs parents (la population P). On trouve essentiellement 2 méthodes de remplacement différentes Le remplacement stationnaire : dans ce cas, les enfants remplacent les parents automatiquement sans tenir compte de leurs performances respectives, et le nombre d'individus de la population ne varie pas tout au long du cycle d'évolution simulé, ce qui implique donc d'initialiser la population initiale avec un nombre suffisant d'individus. Cette méthode peut être mise en œuvre de2 façons différentes: La première se contente de remplacer la totalité de la population P par la population P+1, cette méthode est connue sous le nom de remplacement générationnel. La deuxième méthode consiste à choisir une certaine proportion d'individus de P+1 qui remplaceront leurs parents dans P (proportion égale a 100 % dans le cas du remplacement générationnel). Ce type de remplacement engendre une population ayant une grande variation et de se fait favorise la dérivé génétique qui se manifeste d'autant plus que la population est de petite taille. De plus dans bien des cas, étant donne que même un enfant ayant une faible performance remplace forcement un parent, on n'atteint pas la meilleure solution mais on s'en approche seulement. Le remplacement élitiste : dans ce cas, on garde au moins l'individu possédant les meilleures performances d'une génération à la suivante. En général, on peut partir du principe qu'un nouvel individu (enfant) prend place au sein de la population que s'il remplit le critère d'être plus performant que le moins performant des individus de la population précédente. Donc les enfants d'une génération ne remplaceront pas nécessairement leurs parents comme dans le remplacement stationnaire et de même la taille de la population n’est pas figée au cours du temps. Ce type de stratégie améliore les performances des algorithmes évolutionnaire dans certains cas. Mais présente aussi un désavantage en augmentant le taux de 53 Chapitre II Algorithmes génétiques convergence prématuré. II.3.5- Critères de convergence : Afin de mettre fin à l'algorithme génétique, trois critères de convergence ont été utilisés dans notre travail, si l'un de ces critères est atteint, le processus d'optimisation se termine en convergeant à la solution optimale. Les critères sont : 1. Quand l'erreur normalisée du meilleur chromosome tend a la plus petite valeur (l'erreur de tolérance fixée ε) c-à-d : lorsqu'une solution optimale Sm est connue pour un problème donné, on peut aussi arrêter l'algorithme après l'atteinte d'un optimum pratique a cette solution: Sc Sm 100 Sc (II.4) où :Sc est la solution à comparer, Sm est la meilleur solution (solution optimale) 2. Si le meilleur individu de la population reste inchangé pendant un nombre donne tn de générations, on considère que l'algorithme a convergé et que cette meilleure solution est l'optimum de cette recherche. Ce critère vérifie la création de nouvelles solutions plus performantes parmi la population. 3. Si le nombre d'itérations atteint le nombre de génération NGEN fixe. La figure II.11 illustre un simple algorithme qui explique le critère de convergence 1. Sc est la solution à comparer; 2. A est l'ensemble des solutions qui ont la meilleure fitness 3. j=1; 2. REPETER (a) compare Sc avec A (j) par le calcul de ε(j) (b) Si (ε(j) est minimum) Alors Sm=A(j) (c) j=j+1 4. Sm=A(j) Figure II-11: Critère de convergence 54 Chapitre II Algorithmes génétiques II.3.6- Avantages et inconvénients des algorithmes génétiques : II.3.6.1- Avantages des AG : Les AG opèrent au niveau du codage des paramètres sans se soucier de leur nature, donc ils s'appliquent à de nombreuses classes de problèmes, qui dépendent éventuellement de plusieurs paramètres de natures différentes (booléens, entiers, réels, fonctions...); Pour les mêmes raisons un AG est dans l'idéal totalement indépendant de la nature du problème et de la fonctionnelle à optimiser, car il ne se sert que des valeurs d'adaptation, qui peuvent être très différentes des valeurs de la fonction à optimiser, même si elles sont calculées à partir de cette dernière; Potentiellement les AG explorent tous l'espace des points en même temps, ce qui limite les risques de tomber dans des optimums locaux; Les AG ne se servent que des valeurs de la fonctionnelle pour optimiser cette dernière, on a pas besoin d'effectuer de coûteux et parfois très complexes calculs; Les AG présentent une grande robustesse c'est-à-dire une grande capacité à trouver les optimums globaux des problèmes d'optimisation. II.3.6.2- Inconvenient des AG : Les AG ne sont encore actuellement pas très efficaces en coût (ou vitesse de convergence), vis-à-vis de méthodes d'optimisation plus classiques; Parfois les AG convergent très vite vers un individu particulier de la population dont la valeur d'adaptation est très élevée; Le respect de la contrainte de domaine par la solution codée sous forme de chaîne de bits pose parfois problème. Il faut bien choisir le codage, voir modifier les opérateurs; L'utilisation d'un AG ne garantie pas le succès de l'optimisation; En pratique l'efficacité d'un AG dépend souvent de la nature du problème d'optimisation. Selon les cas, le choix des opérateurs et des paramètres sera souvent critique, mais aucune théorie générale ne permet de connaître avec certitude le bon choix, il faudra faire plusieurs expériences pour s'en approcher. 55 Chapitre II Algorithmes génétiques II.4- Conclusion : On sait que les applications des algorithmes génétiques sont multiples: optimisation de fonctions numériques difficiles, traitement d'image, contrôle de systèmes industriels, cryptographie, apprentissage des réseaux de neurones, etc.... Les algorithmes génétiques seuls ne sont pas très efficaces dans la résolution d'un problème. Ils apportent cependant assez rapidement une solution acceptable. Néanmoins, il est possible de l'améliorer assez efficacement en le combinant avec un algorithme déterministe. Au cours de ce chapitre, un algorithme d'optimisation basé sur les principes des algorithmes génétiques a été présenté. Dans le chapitre IV, cet algorithme sera appliqué à la résolution d'un problème d'optimisation relié au modèle analytique du contournement des isolateurs pollués dans le but de déterminer les constantes de l’arc A et n. 56 Chapitre III Réseaux de Neurones Chapitre III Réseaux de neurones III.1- Introduction: À la suite des observations de l'anatomiste espagnole Ramon y Cajal, dès la fin du 19ème siècle, on a pu déterminer que le cerveau était composé de cellules distinctes appelées neurones formant un ensemble dense d'environ 10 à 100 milliards d'unités interconnectées [Ros-92]. La principale caractéristique de ces neurones est qu'ils permettent de véhiculer et de traiter des informations en faisant circuler des messages électriques dans le réseau tenu et massivement parallèle formé par leur axone. L'extrémité des axones se divise en une multitude de ramifications. A l'inverse, les arborescences qui amènent l'information vers le corps cellulaire sort appelés dendrites. Les informations sont transmises d'un neurone à l'autre, de manière unidirectionnelle, par l'intermédiaire de points de jonction appelés synapses. En moyenne le nombre de connexions entre neurones est de 104. Le schéma d'un neurone réel est propose figure III-1. Figure III-1: Représentation schématique d'un neurone biologique. L'activité d'un neurone se mesure en fonction de la fréquence du train de potentiels d'actions (on spikes) propagés sur l'axone. Cet influx nerveux, lorsqu'il parvient à une synapse, permet de libérer des neuromédiateurs qui excitent (neuromédiateurs excitateurs) ou inhibent (neuromédiateurs inhibiteurs) le neurone suivant et peuvent ainsi générer ou interdire la propagation d'un nouvel influx nerveux. Une caractéristique fondamentale de la synapse est qu'elle est capable de s'adapter et ainsi faciliter ou non le passage des influx nerveux. Cette plasticité est à l'origine des mécanismes d'apprentissage. 58 Chapitre III Réseaux de neurones L'influx nerveux se caractérise par une impulsion électrique (Potentiel d'Action ‘’PA‘’) se déplaçant le long de l'axone depuis le corps cellulaire jusqu'aux synapses. Le déplacement du PA est généré par une diminution locale de la différence de potentiel entre l'intérieur et l'extérieur de la membrane de la cellule qui provoque l'ouverture des canaux sodiques de la membrane laissant entrer les ions sodium (Na + ). Le potentiel ayant toujours tendance à revenir à une valeur d'équilibre, la cellule libère des ions potassium (K+). C'est ainsi que de proche en proche se propage l'influx électrique jusqu'aux synapses. Une synapse est constituée d'un bouton présynaptique situé en prolongement de l'axone du neurone afférent et d'une partie réceptrice sur le corps du neurone efférent, les deux étant séparés par un espace extracellulaire très faible appelé fente synaptique. Le bouton présynaptique contient des vésicules synaptiques remplies de transmetteurs chimiques. Lorsque le PA parvient à la synapse, il fait rentrer des ions calcium (Ca2+) dans le corps cellulaire du neurone. Cela provoque l'alignement d'une partie des vésicules synaptiques le long de la membrane du bouton synaptique et donc la libération des neurotransmetteurs dans la fente synaptique. Les molécules transmettrices libérées arrivent sur le site récepteur du neurone efférent et rentrent en interaction avec les protéines réceptrices situées sur ces sites. La réaction résultante peut être dépolarisante (synapse excitatrice) ou hyperpolarisante (synapse inhibitrice) selon les affinités entre le neurotransmetteur et la protéine réceptrice. Les activités polarisantes ou dépolarisantes sont ensuite sommées par le neurone ce qui déclenche ou non un nouvel influx nerveux dans le neurone efférent, selon qu'un seuil de dépolarisation est franchi on non. III.1.1- Modèle du neurone formel : Dans la plupart des modèles formels, on représente l'activité du neurone par une grandeur analogique qui s'identifie à la fréquence d'émission des potentiels d'action sur l'axone. On ne tient donc pas compte de l'aspect séquentiel de la propagation de l'information dans les neurones biologiques. Dans la majorité des cas, ce modèle est suffisant. Considérons le modèle de neurone formel présenté figure III-2. Soit Ii l'entrée d'un neurone (activité du neurone précédent). 59 Chapitre III Réseaux de neurones Soit Wij le poids synaptique associe à la synapse liant le neurone i au neurone j. Soit O j la sortie du neurone j. Wi1 I1 j Oj ∑ Win In Figure III-2: Schéma d'un neurone formel On définit aussi, Le potentiel : Pot j Wij . I i (III-1) La fonction d'activation (ou fonction de sortie) : (III-2) O j(t ) = f (Pot j) Les entrées et sorties sent soit binaires soit réelles. La fonction de sortie est une fonction non linéaire plus ou moins proche de la sigmoïde. Les principales fonctions de sortie sont: 1 si x 0 La fonction de Heaviside : H ( x) 0 si x 0 (III-3) 1 si x 0 La fonction signe: Sign( x) 1 si x 0 (III-4) 1 si x a 1 Les fonctions linéaires à seuils : f ( x) x si a, a 2 1 si x a (III-5) Les fonctions sigmoïdes: f ( x) tanh(kx) ou les fonctions a base radiale (Radial Basis Functions - RBF) : 1 1 e kx (III-6) 60 Chapitre III Réseaux de neurones x f ( x) exp( ) 2 , f ( x) 1 1 x t2 ,... (III-7) 2 La modélisation des phénomènes de plasticité synaptique ont, par ailleurs, permis de développer des modèles de neurone formel expliquant certains des mécanismes d'apprentissage. L'un des premiers essais de modélisation de l'apprentissage associatif, a été réalisé par Hebb [Heb-49] dès 1949. La règle qu'il a énoncée s'exprime ainsi : "Quand une cellule A excite par son axone une cellule B et que, de manière répétée et persistance, elle participe à la genèse d'une impulsion dans B, un processus de croissance ou un changement métabolique a lieu dans l'une ou dans les deux cellules, de telle sorte que l'efficacité de A à déclencher une impulsion dans B est, parmi les autres cellules qui ont cet effet, accrue. " En utilisant les notations propres au neurone formel, on pent traduire cet enonce sous la forme suivante : Wij(t+1)= Wij(t) + ε.Ii.Oj (III-8) Cette règle est à la base de nombreux mécanismes d'apprentissage, et en particulier a l'origine des modèles que nous présenterons dans les paragraphes suivants. III-2 Réseaux de neurones supervises : III-2.1 Mémoire associative linéaire : Le réseau de neurones comporte p entrées (x i [1, p]) entièrement connectées à n sorties (y k [1, n]). Pour simplifier la notation, on utilise une représentation matricielle. La mémoire associative fonctionne en deux phases : 1. une phase d'apprentissage, pendant laquelle les poids ont des valeurs modifiables 2. une phase de rappel, pour laquelle les connexions sont figées III.2.1.1- Apprentissage : La phase d'apprentissage consiste à faire apprendre une association entre un 61 Chapitre III Réseaux de neurones vecteur xr et un vecteur yr. A chaque présentation d'une association, on propose de modifier les poids suivant la règle : W y r . ( x r ) T (III-9) Apres une présentation de tous les exemples, la matrice de poids vaut : N W ( y r )T (III-10) r 1 La matrice est égale à la somme des matrices de corrélations des vecteurs. Par ailleurs, il faut noter que les associations sont apprises de manière diffuse dans la matrice (on dit aussi délocalisée ou distribuée). La matrice des poids est maintenant fixée, on stimule le réseau avec un vecteur x (clef) et on observe la sortie y = W• x . En remplaçant W, on a: N y W . x y r ( x r ) T . x (III-11) r 1 Soit le produit scalaire entre la clef x et les prototypes xr. Si la clef est égale à un vecteur xj, présente pendant l'apprentissage, et si tous les vecteurs xr sont orthogonaux, un seul produit scalaire est non nul, celui qui correspond à r = j. On a alors : y = Norme 2 (x j ) • y j = k • yj (III-12) Que se passe-t-il en présence de bruit, par exemple si x= xj + b ? y k . y j y r ( x r )T .b (III-13) r 1 Le premier terme correspond au rappel, le second à une erreur qui dépend : de l’énergie du bruit de la correlation bruit/prototype du nombre N de prototypes à mémoriser III.2.2- Réseaux de Hopfield : Le modèle de Hopfield est issu de la physique statistique (études des verres de spins). 62 Chapitre III Réseaux de neurones Dans le formalisme de la physique, on considère un ensemble de "sites" possédant un spin (+1 ou -1). Les interactions Tij entre 2 sites sont supposées symétriques (Tij = Tji) sans auto entretient (T ii = 0). On étudie la relaxation du système. L'élaboration d'un modèle neuronal inspire de ce formalisme date de 1982. On identifie aisément les sites avec des neurones binaires, les interconnexions avec les poids synaptiques et la relaxation avec la convergence du réseau. L'intérêt du formalisme de Hopfield est d'associe au réseau une grandeur homologue à une énergie III.2.2.1- Dynamique du réseau : On définit un potentiel local u i pour chaque site i: N u i Tikvk , k i (III-14) k 1 avec vi = Signe(u i ) L'évolution dynamique du réseau est la suivante : 1. On tire au hasard un site i Si u i > 0 alors vi ← +1 Si ui < 0 alors vi ,← - 1 2. on recommence en 1 Petit à petit, l'état du réseau se stabilise a des valeurs qui dépendent des états initiaux et de la matrice des poids. Considérons en effet l'énergie du réseau. Soit I l'état du réseau constitue par l'ensemble des états élémentaires de chaque site : I=(vi , v zi ..., v N ) . On peut associer à I une énergie totale E(I) qui est égale à la demie somme des produits entre les potentiels locaux u i et les états des sites vi : 1 1 1 E ( I ) u t v ui vi Tik vk vi 2 2 i 2 i k (III-15) 1 2 Cette forme E( I ) = - vtT t v est une énergie car T est symétrique. Comme v, T et 63 Chapitre III Réseaux de neurones u sont bornés, l'énergie E est bornée est évolue de manière à être minimale. III.2.2.2- Evolution de l'énergie : Au temps t : 1 E(t)= vt (t )T t v(t) 2 (III-16) Au temps t + 1 : E(t + 1) = 1 t 1 v (t + i)Ttv(t + 1) = [vt (t) + ovt (t)]T [v(t) + Δ (t )] 2 2 (III-17) 1 ΔE = [vt (t)TΔvt + ΔvtTv(t) + ΔvtTΔv] 2 (III-18) D'ou : Comme à chaque pas, uniquement un site change d'état v=(0,0,..., vi , . . . , 0)t : v t (t )Tv vi Tij v j (III-19) j v t Tv(t ) vi Tij v j (III-20) v t (t )Tv viTii vi 0, car Tii 0 (III-21) E vi j Tij v j vi ui (III-22) j Donc : On peut étudier tous les cas possibles en fonction des valeurs de u i(t) et vi(t) : vi(t) -1 +1 ui(t) > 0 Δvi = +2 Δvi = 0 ui(t) < 0 Δvi = 0 Δvi = -2 Dans tous les cas, les produit est donc soit positif soit nul, donc, l'énergie décroît. III.2.2.3- Application au cas des MA : On vent mémoriser des états Ik associés à des états de sites vik . Construisons une fonction d'énergie associée : 64 Chapitre III Réseaux de neurones 1 1 F ( I ) v t , v 2 ( vik vi ) 2 2 2 k i Si les états Ik sont orthogonaux, on a v v k l i i (III-23) N kl où N est le nombre de sites et i δkl le symbole de Kronecker. N2 F ( I ) Emin 2 l (III-24) Comme la dynamique du réseau de Hopfield converge toujours vers un minimum d'énergie, nous avons E = F(I) : 1 1 E vi ( Tij v j ) F ( I ) (vit vi ) 2 2 i 2 k j (III-25) En développant : E 1 1 k k k k vi vi v j v j vi ( vi v j )v j 2 k i j 2 i j k (III-26) En identifiant, on trouve donc : Tij vik v kj (III-27) T v k (v k ) t (III-28) k Ou encore : k Ce qui correspond à la matrice de connexion dune mémoire associative utilisant l'apprentissage de Hebb. Le rappel d'un mémoire associative correspond donc à la minimisation d'une énergie. III.2.3- Limitations des MA : En pratique, il est difficile de satisfaire la contrainte d'orthogonalité. Cependant, pour des tailles de réseaux importants (par exemple des images), la condition d'orthogonalité est presque vérifiée (on peut aussi pré traiter les données de manière a les orthogonaliser). Ces mémoires peuvent alors être utilisées en 65 Chapitre III Réseaux de neurones mémoires auto-associatives. Dans ce cadre, les vecteurs d'entrée et de sortie sont égaux (y = x). La mémoire est alors utilisée pour retrouver un vecteur à partir d'un morceau de celui-ci (cf. exemple images). On voit que les limitations de ce genre de réseaux de neurones sont importantes. C'est a mettre en rapport avec sa faible capacité de stockage (pour une dimension N, le nombre de connexions est N•(N - 1), soit une capacité de 1 ) N 1 Un autre point important est que, toute distorsion par translation, homothétie ou rotation empêche la conservation de l'orthogonalité des vecteurs. Ceci montre la limitation des modèles linéaires à une couche. III.2.4- Perceptron : Le Perceptron, mis au point par Rosenblatt dans les années 50, est l’un des plus simples classifieurs neuronaux. Il comporte une seule couche de neurone qui reçoivent comme vecteur d'entrée X. Leur activité est donnée par : Act i wi xi (III-29) yi signe( Act i ) (III-30) i La règle d'apprentissage du Perceptron est la suivante : wi (t 1) wi (t ) ( y id (t ) y i (t ) xi (t ) (III-31) Si les entrées sont linéairement séparables, l'algorithme converge vers un hyperplan séparant les entrées [Ros-62]. III.2.5- Adaline : Le réseau Adaline a été développé par Widrow [Widrow and Hoff, 1960]. Il est constitue d'un unique neurone effectuant la combinaison linéaire de ses entrées. Il s'agit en fait d'un Perceptron sans saturation des sorties. La règle d'apprentissage de ce réseau consiste à minimiser l'erreur quadratique en sortie du réseau de neurone. La règle d'apprentissage est identique a celle du Perceptron, à la différence prêt que ce sent les entrées non-saturées qui sont prises en compte. 66 Chapitre III Réseaux de neurones III.2.6- Limitations : Les réseaux Adaline et Perceptron ne peuvent partitionner l'espace d'entrée que de manière linéaire. On peut ainsi écrire un résauune couche qui fabrique un OR, un AND ou un NOT, mais il est impossible de fabriquer la fonction XO R à moins d'augmenter le nombre de couches. La limitation est que pour résoudre un problème donné, on ne sait pas a priori le nombre de couches nécessaires. III.2.7- Rétropropagation du gradient : Nous savons que les modèles Adaline et le Perceptron avaient de bonnes performances s'il s'agissait de traiter des problèmes linéairement séparables. L'idée de la rétropropagation consiste à utiliser une fonction de transfert non-linéaire mais dérivable, de manière h poursuivre la minimisation de l'erreur de couche en couche. Le calcul se déroule en 2 temps : on effectue la mise à jour du réseau en avant on rétropropage l'erreur à partir de la sortie jusqu'à l'entrée Soit yik la sortie d'un neurone i de la couche k. p yik wij y kj 1 j i (III-32) On veut minimiser l'erreur quadratique sur la couche de sortie, par rapport à une sortie désirée : 1 n E ( y i y di ) 2 2 i 1 (III-33) III.2.7.1- Une couche : Pour un réseau à une couche, la différentiation de l'erreur donne : n ( y i y di ) E ( y i y di ) wik wik j i (III-34) La seule valeur non-nulle est la composante correspondant à j = i, car seule la sortie yi est fonction du poids wik. De plus, la sortie désirée ne dépend pas du poids. On a 67 Chapitre III Réseaux de neurones alors : y E ( yi y di ) i ( y i y di ) x k ' ( pi ) wik wik (III-35) En posant i ( y i y di ) ' ( pi ) on a alors le gradient de l'erreur quadratique : E i .x k wik (III-36) Pour minimiser l'erreur quadratique, il faut donc utiliser la règle d'apprentissage : wi (t 1) wi (t ) ( y id (t ) y i (t )) xi (t ) (III-37) qui correspond bien à la règle d'adaptation de l'Adaline. III.2.7.2- Deux couches : De la même manière, on cherche à minimiser l'erreur quadratique. Calculons le gradient de l'erreur par rapport au poids W2kh connectant le neurone h, de la couche 1 au neurone k de la couche 2: E E p i3 2 wkh2 icouche 3 pi3 wkh (III-38) Calculons d'abord : E E yi3 pi3 y i3 p i3 (III-39) 1 n de: yi3 wij3 . y 2j et comme E i 1 ( y i3 y di ) 2 2 jcouche 2 on tire : E ( y i3 y di ) ' p i3 p i3 (III-40) pi3 w 3 . y 2j 2 2 ij wkh wkh jcouche 2 (III-41) Par ailleurs : Comme y k2 est le seul terme qui dépend de wkh on a: 68 Chapitre III Réseaux de neurones pi3 wik3 y k2 2 2 wkh wkh (III-42) en remplaçant y k2 par sa valeur, on a: pi3 3 2 1 w ( w . y ik km m wkh2 wkh2 jcouche1 (III-43) Un seul terme est non nul (m = k) pi3 wik3 ' ( p k2 ). y 1h wkh2 (III-44) Revenons à l'équation initiale : E ( y i3 y di ). ' ( pi3 ).wik3 . ' ( p k2 ). y 1h 2 wkh icouche 3 (III-45) En posant i3 ( y i3 y di ). ' ( p i3 ) , on a: E i3 .wik3 . ' ( pi3 ). y 1h 2 wkh icouche 3 (III-46) Cette expression est formellement identique an gradient de E par rapport à un poids de la dernière couche si on pose : k2 i3 .wik3 . ' ( p k2 ) icouche3 (III-47) Par conséquent, l'erreur affectée à un neurone k de la couche 2 est égale à la somme des erreurs de la couche suivante pondérée par les poids reliant le neurone k à ces neurones de la couche 3. On propose finalement la règle de modification suivante : wkhj . kj . y hj 1 (III-48) Avec : yk y dk j j 1 j 1 j k i .wik . ' ( p k ) pour les autres couches icouchej 1 j (III-49) 69 Chapitre III Réseaux de neurones III.2.7.2.1- Remarques sur l'utilisation de la rétropropagation : a) Lissage : L'algorithme de rétropropagation brut correspond à un algorithme de type gradient stochastique fonde sur la minimisation d'une erreur instantanée. En pratique, on ajoute un terme de filtrage sur les incréments d'adaptation qui correspond a une pondération des erreurs quadratiques : 1 N n i E ( n) y yd 2 i 1 2 (III-50) Avec < 1. On a alors la règle d'apprentissage : w jk (n) a j (n) x k (n) w jk (n) (III-51) Ce qui correspond à la pondération exponentielle des erreurs. En pratique est inférieur et voisin de 1. On peut choisir un oubli variable faible au départ et tendant vers 1. b) Valeurs initiales : Les valeurs initiales des poids doivent être différentes de 0 sinon le réseau de peut pas apprendre ! En pratique, on choisit une valeur aléatoire comprise dans la dynamique des poids. c) Test d'arrêt : Le plus simple est de fixer un nombre d'itérations. En pratique on possède une base d'apprentissage et une base de test. On alterne apprentissage sur la BA et mesure de performances sur la BT jusqu'a atteindre des résultats convenables. d) La rétropropagation comme approximateur universel : Des résultats théoriques ont montre que les RN à 3 couches (2 couches cachées) peuvent approximer des fonctions continues de Rp (ou des compacts) dans [0,1]. Cependant, on ne sait pas comment construire le réseau ni combien de neurones sont nécessaires dans la couche cachée. Celui-ci peut être infini ! 70 Chapitre III Réseaux de neurones III.3- Réseaux de neurones non-supervises : III.3.1- Winner Take All (WTA) : Le WTA simule les mécanismes de compétition existant entre neurones ou populations de neurones. Le modèle courant utilise des groupes de neurones formels dont l'apprentissage est fixé par la règle de Hebb. L'ajout de liaisons inhibitrices latérales permet de simuler le processus de compétition. Après convergence, seul le neurone ayant la plus grande activité reste actif et inhibe tous les autres [Rum85], [Lip-87]. Ce type de WTA est utilisé comme moyen de catégoriser les vecteurs présentés en entrée du réseau. En effet, si on présente ceux-ci un nombre suffisant de fois, chaque neurone du WTA acquiert une sensibilité différente (il faut cependant que les vecteurs soient orthogonaux entre eux sinon le même neurone peut gagner pour toute une famille de formes) [Gro-88], [Koh-84]. Le modèle "Instar" de Grossberg utilise un mécanisme de compétition sur deux couches [Gro-73]. Ce n'est pas un WTA pur, mais plutôt un mécanisme de rehaussement de contraste. Nous en présentons cependant les caractéristiques afin de mieux appréhender le fonctionnement des mécanismes de compétition. Dans ce modèle, chacun des N neurones d'une première couche envoie des liaisons inhibitrices sur l'ensemble des N neurones de la couche suivante excepte le neurone correspondant à l a position du neurone de la couche d'entrée qui reçoit un lien activateur (voir figure III-1). xi est la valeur instantanée du potentiel d'un neurone i du groupe de sortie. Ik est l'activité du neurone k de la couche d'entrée. La dynamique de chacun des neurones de la couche de sortie est modélisée par l'équation : dxi Axi ( B xi ).I i xi I k dt k i (III-52) 71 Chapitre III Réseaux de neurones Xi - - + - Ii - Ik Figure III-3 : Compétition à deux couches : modèle INSTAR N On pose A et B > 0, I I i et i i 1 Ii . Le vecteur θ =( θ1,…., θN)T est I appelé reflectance pattern. Le terme –Axi est un terme de décroissance passif du potentiel du neurone. (B-xi)•Ii représente l'influence du lien activateur connectant le neurone de la couche d'entrée et celui de la couche de sortie. Enfin, le terme xi I k représente k i l'influence des inhibitions provenant des autres neurones. Il est à noter que le potentiel x i est borné entre 0 et B. Apres un régime transitoire, on obtient la valeur a l'équilibre lorsque dxi 0 . La valeur moyenne X i du potentiel des neurones de la couche de sortie est dt alors : I i .B B.I i A I A I Xi (III-53) On déduit de cette équation que l'activité globale de sortie est normalisée puisque X i B.I I .B i B A I A I (III-54) 72 Chapitre III Réseaux de neurones Un mécanisme de compétition à une couche a aussi été propose par Grossberg (voir figure III-2). L'équation différentielle régissant le comportement du réseau s'écrit alors : dxi Axi ( B xi ). f ( xi ) I i xi f ( x k ) I k dt k i (III-55) Avec f(.) la fonction de sortie du neurone. + - - - - Figure III- 4: Compétition sur une couche III.3.2- Carte de Kohonen : Il a été observé que, dans de nombreuses zones du cortex, des colonnes voisines ont tendance à réagir à des entrées similaires. Dans les aires visuelles, par exemple, deux colonnes proches sont en correspondance avec deux cellules proches de la rétine [Hub-77]. Des observations identiques on pu être faites dans le bulbe olfactif , ou l'appareil auditif [Knu-79]. Ces observations ont mené Kohonen à proposer un modèle de carte topologique auto-adaptative qui permet de coder des motifs présentés en entrée tout en conservant la topologie de l'espace d'entrée. Dans la plupart des applications, les neurones d'une carte de kohonen sont disposés sur une grille 2D (figure III-5.b). Le poids associe aux liaisons latérales entre neurones est fonction de la distance entre le neurone source et le neurone cible. La valeur du poids est donnée par une fonction "chapeau mexicain" (Différence Of Gaussians - DOG – (voir figure III-5.b). Les connexions provenant des entrées, quant à elles, arrivent perpendiculairement au plan forme par les liaisons latérales. 73 Chapitre III Réseaux de neurones Figure III-5 : a) Schematisation d'un carte de Kohonen. b) Représentation d'une différence de 2 gaussiennes. On distingue deux types de fonctionnement. Dans un premier temps, l'ensemble des formes devant être apprises sont présentées au réseau et les vecteurs de poids sont mis à jour de manière à approximer les vecteurs d'entrée. Les paramètres de la carte sont adaptés au fur et à mesure pour qu'elle se stabilise de plus en plus. La deuxième étape est la phase d'utilisation proprement dite. Dans ce cas, on présente un motif particulier et c'est le neurone dont le vecteur de poids minimise la distance avec le vecteur d'entrée qui réagit. Le mécanisme d'apprentissage est le suivant. La carte comporte N neurones organisés sur une grille rectangulaire. Chaque neurone est relié à M entrées. Le vecteur des poids est donné par Wi =[Wi1 ,….;WiM] T Le vecteur d'entrée est donne par I=[I i1 ,….;I M] Les poids des liaisons latérales sont initialises aléatoirement. On calcule la distance entre le vecteur présenté et le vecteur de poids de chaque neurone: M d i ( I j Wij ) 2 (III-56) j 1 On choisit le neurone dont la distance avec le vecteur d'entrée est la plus petite. Les poids de ce neurone sont mis à jour selon l'équation : Wkj (t 1) Wkj (t ) (t ).( I j (t ) Wkj (t )) (III-57) 74 Chapitre III Réseaux de neurones Le coefficient d'apprentissage (t) est choisi dans [0, 1]. Il doit décroître peu à peu. Le voisinage des neurones est mis a jour de manière à se rétrécir au cours du temps. On recommence sur l'ensemble des motifs jusqu'à la stabilisation complété des poids. Apres un long temps de convergence, le réseau évolue de manière à représenter au mieux la topologie de l'espace de départ. Il faut en fait noter que la notion de conservation de la topologie est en fait abusive puisqu'en général la taille du vecteur d'entrée est bien supérieure à la dimension de la carte (souvent 2) et il est donc impossible de conserver parfaitement la topologie. En fait le terme de quantification vectorielle de l'espace d'entrée doit plutôt être utilise. L'implémentation n'est pas biologiquement plausible : le temps de convergence est trop long pour expliquer notre capacité à apprendre une forme en un seul essai. Le point le plus important est que pour permettre la réduction du voisinage, la valeur des liens latéraux doit changer. Ainsi un lien activateur peut devenir inhibiteur ! Un autre point est que la qualité de la convergence du réseau dépend grandement des paramètres spécifiant la vitesse d'apprentissage et la taille du voisinage. Ces paramètres sont fixes de manière subjective par le programmeur. Dans [Koh-93], Kohonen souligne que la modification de ces paramètres pourrait provenir des transformations ontogénétiques du cerveau. Il faut aussi noter que les cartes de Kohonen ne peuvent pas être utilisées "en ligne" puisque pour assurer la convergence : il faut pouvoir présenter plusieurs centaines de fois l'ensemble des motifs. Or, dans le contexte d'un système autonome, on ne peut connaître à l'avance l'ensemble des formes qui seront rencontrées. Par ailleurs, pour que la carte apprenne correctement, il est nécessaire de présenter les formes de façon aléatoire (ce qui est difficile à imaginer dans un contexte réel). On ne pourra donc pas utiliser les cartes de Kohonen pour catégoriser des formes, mais elles peuvent servir de justification à nos pre-traitements au niveau des images (apprentissage de la forme des filtres de bas niveau, détecteurs de contours...) 75 Chapitre III Réseaux de neurones III-4. Conclusion : Après cette présentation générale on a pu montrer que les réseaux de neurones reposent a présent sur des bases mathématiques solides qui permettent d'envisager des applications dans presque tout les domaines y compris industriel et a grande échelle, notamment dans le domaine de la prédiction. Si la résolution des problèmes difficiles nécessite toujours et nécessitera encore très longtemps beaucoup de travail et un éventail étendu de connaissances en statistiques, traitement du signal, automatique..., etc. Il n’est pas douteux que les réseaux de neurones peuvent alléger considérablement la tache de toute personne travaillant dans ces domaines en permettant une approche efficace et générique des problèmes non linéaires. 76 Chapitre IV Applications, résultats et discussions Chapitre IV Applications, résultats et discussions IV.1- Introduction : La tension critique de contournement d’un isolateur pollué est un paramètre significatif de la fiabilité d’un système d’énergie, plusieurs approches ont été développées pour l’estimation de la tension de contournement. L’exposition du matériel isolant à des différentes conditions environnementales est inévitable dans tous les systèmes énergétiques. Les principaux types de pollution des isolateurs sont la pollution naturelle et la pollution industrielle si ce n’est pas les deux à la fois! La coexistence du duo, la pollution (naturelle et/ou industrielle) et l’humidité (rosée, brouillard ou la pluie) est une condition défavorable à l’isolateur. La présence de particules électrolytes avec l’humidité peut former un film fin avec conductibilité élevée sur la surface de l’isolateur. Cette couche réduit la résistance de la surface et conduit à un courant de fuite. Le résultat de ce courant est l’échauffement ohmique de la surface et création d’une bande sèche, cette dernière une fois formée, des décharges partielles peuvent apparaître et si la tension et le courant de fuite arrivent à une certaine valeur critique, le phénomène de contournement peut apparaître. Il y a plusieurs techniques utilisées pour la réduction de ce phénomène et quelques une de ces techniques font inclure un nettoyage périodique des isolateurs pollués. Cependant, si le programme de nettoyage et de maintenance n’est pas bien établi il peut coûter chère. L’étude expérimentale de la tension critique de contournement prend beaucoup de temps et rencontre plusieurs obstacles, comme le coût très élevé et la nécessité d’un équipement spécial, sont à l’origine du développement de plusieurs approches pour l’estimation de la tension de contournement d’un isolateur pollué. La plupart sont basées sur des modèles mathématiques et des relations analytiques pour la tension de contournement des isolateurs pollués. La technique de l’intelligence artificielle peut être utilisée dans les problèmes exigeants des fonctions d’approximation, des classifications et connaissance schématiques, des estimations et prédictions …. Dans le domaine des isolateurs haute tension, l’intelligence artificielle peut être utilisée pour l’estimation du degré de pollution, la prédiction d’un contournement, l’analyse des pistes sur les surfaces des isolateurs pollués et également l’estimation 78 Chapitre IV Applications, résultats et discussions de la tension de contournement d’un isolateur pollué. Ce dernier cas va être soigneusement examiné dans ce travail. Ce travail essaye d’utiliser les valeurs expérimentales et les résultats des approches théoriques pour construire et établir un ANN qui peut estimer la valeur de la tension critique de contournement et un AG qui détermine les constantes de l’arc « A » et « n » du model mathématique qui donnent les meilleurs résultats, en utilisant comme données les caractéristiques de l’isolateur. IV.2- Procédures expérimentales et collection de données : Les expériences ont été réalisées sur un isolateur de station de test installé dans un laboratoire de Haute Tension de PPCTRSC à Athènes et conformément aux normes IEC [Kon-06]. Dans cette station qui est constituée principalement de deux chambres, chambre de pollution et chambre de brouillard, les essais ont été faits sur des isolateurs pollués artificiellement dans le but de déterminer la tension de contournement. La pollution est simulée conformément à la méthode de la couche solide. Avant la suspension des l’isolateurs dans la chambre de pollution, ils ont été soigneusement lavés pour enlever toutes les traces de graisse, en les émergeant dans une solution de trisodium de phosphate et en les rinçant avec de l’eau du robinet. Le contaminant utilisé était : 75 g/l d’argile de kaolin, 675 g/l poudre de silice, NaCl comme exigé, et suspendu dans l’alcool isopropyl. La contamination à besoin d’une durée de 30 min. Après que les isolateurs sont contaminés, ils doivent être laissés sécher pendant une heure. La DDSE sur la surface de l’isolateur est mise selon un index de sévérité de pollution. Durant l’exposition des isolateurs au brouillard dans la chambre de brouillard le système de jet est conforme aux normes de la CEI. Le temps nécessaire pour atteindre le maximum de conductivité de la couche conductrice est d’environ 35-40 min après cela la tension d’essai est appliquée sur l’isolateur dans un temps qui ne doit pas dépasser 5 s et doit être maintenue jusqu’au contournement. On retire l’isolateur de la chambre de brouillard et on le laisse sécher. On recommence l’opération trois fois. 79 Chapitre IV Applications, résultats et discussions IV.3- Les algorithmes génétiques : Les chromosomes sont les éléments de base de la biologie génétique. Ils se croisent entre eux, passent à une auto mutation et un nouveau groupe de chromosomes est généré, selon les exigences seulement quelques chromosomes survivent, c’est le cycle des générations dans la biologie génétique. Ce processus se répète pour plusieurs générations et en fin le meilleur groupe de chromosomes selon les exigences sera retenu. Ça c’est le processus naturel de la biologie génétique. L’algorithme mathématique équivalent à ce comportement utilisé comme une technique d’optimisation est appelé algorithme génétique artificiel. Considérons le problème de maximiser la fonction f(x) dont x varie de « m » à « n ». La fonction f(x) est appelée la fonction appropriée (fitness). La population initiale de chromosomes est générée aléatoirement c'est-à-dire les valeurs de la variable « x » sont sélectionnées aléatoirement entre « m » et « n ». Supposons que les valeurs sont x1, x2, …. , xL où « L » c’est la taille de la population, qui sont appelés des chromosomes dans le contexte biologique. Les opérations génétiques comme le croisement et la mutation sont faites pour obtenir 2L chromosomes comme décrit ci-dessous : Deux chromosomes de la population sont sélectionnés aléatoirement c'est-àdire deux nombres sont sélectionnés. L’opération de croisement génère deux autres nombres y1 et y2 en utilisant les nombres sélectionnés. Soit les nombres sélectionnés sont x3 et x9. y1 est calculée comme suit : y1=r.x3+(1-r).x9 (IV-1) et de même y2 est calculé : y2=(1-r)x3+r.x9 (IV-2) Où « r » est un nombre aléatoire généré entre « 0 » et « 1 ». La même opération est répétée « L » fois pour obtenir « 2L » nouveaux chromosomes générés. L’opération de mutation est faite pour les chromosomes obtenus pour passer à 2L chromosomes mutés. C'est-à-dire le nombre généré y1 est muté pour obtenir z1 qui est calculé mathématiquement comme suit : z1=r1.y1 (IV-3) 80 Chapitre IV Applications, résultats et discussions Où r1 est un nombre aléatoire entre « 0 » et « 1 ». Donc le nouveau groupe de chromosomes obtenus après croisement et mutation est [z1, z2, …. , z2L]. Parmi les 2L valeurs obtenues après les opérations génétiques « L » valeurs seront sélectionnés par la loi de la roulette [Gop-07]. IV.3.1- Model mathématique : Le processus de contournement des isolateurs pollués a été soigneusement étudié par plusieurs recherches. Le modèle le plus simple est celui développé par Obenhaus qui consiste à un arc qui saute la zone sèche et la résistance de la zone mouillée de la pollution en série. En appliquant la loi d’ohm sur le circuit de la figure IV-1 : arc Rp L-X X L Figure IV-1 : Circuit électrique équivalent du model d’Obenaus Donc la tension aux bornes de l'isolateur sera: U xAI n ( L x) R p I (IV-4) Où xA-n : est la tension de l'arc (L-x) RpI: est la tension dans la couche de pollution. x : La longueur de l'arc L : La ligne de fuite de l'isolateur RP : La résistance par unité de longueur de la couche de pollution I: Le courant de fuite A et n sont les constantes de l'arc. 81 Chapitre IV Applications, résultats et discussions La mesure de la résistance Rp de la zone humide est très compliquée. Donc on peut la substituer à la conductivité p de la couche de pollution p 1 Fi Rp (IV-5) Fi : est le facteur de forme de l'isolateur qui est donné par : L 1 dl D (l ) 0 Fi (IV-6) Où D(l) est le diamètre de l'isolateur qui varie selon la ligne de fuite [Kuf-00]. La condition critique de la propagation de la décharge le long de la surface de l'isolateur pour causer le contournement est: dI 0 dx (IV-7) Et le voltage sous cette condition critique devient: U c xc AI c n ( L xc ) kRp I c (IV-8) Ici le coefficient k est ajouté pour valider la relation (IV-4) à l'instant critique du contournement. Wilkins a introduit ce coefficient pour modifier RP la résistance de la couche de pollution en considérant la concentration du courant au point du pas de l'arc, une formule simplifiée pour le calcul de k pour les isolateurs cap-and-pin. k 1 L Ln 2Fi ( L xc ) L Ic 2Fi 1,45 (IV-9) A la condition critique, la longueur de l'arc prend la valeur: xc 1 L n 1 (IV-10) 82 Chapitre IV Applications, résultats et discussions Après une analyse du système d'équations au moment du contournement le courant critique devient: I c (D r p A) 1 n 1 (IV-11) Et la tension critique: n A Uc ( L D r Fi kn ) ( D r p A ) n 1 n 1 (IV-12) Où Dr est le diamètre de l'isolateur. L'équation (IV-12) fournie la valeur critique de la tension au moment du contournement en fonction des dimensions de l'isolateur (Dr et L), les constantes de l'arc A, n et la pollutionp pendant que Fi et k sont aussi fonction des dimensions de l'isolateur. Evidemment la tension critique peut être calculée après la détermination des constantes de l'arc. Ce sont les paramètres inconnus du modèle. IV.3.2- Détermination des constantes de l’arc « A » et « n » : La plupart des travaux sur les isolateurs pollués ont utilisé des constantes caractéristiques de l’arc « A » et « n » pour différentes atmosphères en supposant que la décharge se propage à travers une atmosphère humide ou bien dans la vapeur de l’eau. Gonos et topalis [Gon-02] ont proposé A=124.8 et n=0.409, ces valeurs peuvent converger vers de bons résultats pour la plupart des problèmes. Farzaneh [Zha-00] a recommander une combinaison A=208.9 et n=0.449 sur une surface recouverte de glace en utilisant un échantillon triangulaire. Ghosh et Chatterjee [Gho-95] ont trouvé que les valeurs de « A » et « n » dépendent des polluants chimiques. Zegnini [Zeg-07] a montré en utilisant l’équation d’Ayrton, que la variation de la longueur de l’arc a un effet considérable sur ces constantes. M ElA.Slama et al de leur tour ont montré que ces caractéristiques ne sont pas statiques et ont une relation avec les paramètres du circuit équivalent et des caractéristiques thermique de la décharge. 83 Chapitre IV Applications, résultats et discussions D’où cette divergence dans les valeurs proposées pour les constantes « A » et « n » ( tableau IV.1)[Sla-10]. Auteurs La constante « A » La constante « n » Alston and Zoledziowski 63 0,760 Wilkins 63 0,760 Rahal 220 0,310 Claverie 100 0,500 Hampton 530 0,240 Obenaus 100 0,700 Renyu 138 0,690 208.9 0,449 Ghosh 360 0,590 Topalis 131.5 0,374 Farzaneh Tableau IV.1 Dans ce travail on a construit une base de données à partir des résultats des travaux de plusieurs chercheurs dans ce domaine et on a essayé de proposer des valeurs pour « A » et « n » en résolvant l’équation issue du modèle d’Obenaus par une méthode numérique qui est l’algorithme génétique. IV.3.3- Application à l’estimation de la tension de contournement : Considérons le problème d’optimisation pour maximiser la fonction : 196 Fg=1- U i 1 ci f i ( A, n) (IV-13) Bien sûre la valeur maximale de Fg correspond à la valeur minimale de 196 U i 1 ci f i ( A, n) ce qui mène à déterminer A et n qui vérifient cette condition cette opération donc à pour but de déterminer les constantes de l’arc A et n. Dans la littérature on trouve que « A » varie entre « 0 et 500 », et « n » entre « 0 et 1 ». Les nombres entre « 0 et1 » à un pas de 0,001 pour n et entre « 0 et 500 » à un pas de 0,01 pour A, sont traités comme des chromosomes utilisés dans 84 Chapitre IV Applications, résultats et discussions les algorithmes génétiques. C'est-à-dire on a utilisé des chromosomes flottants une population d’une taille de 20 chromosomes survit dans chaque génération, un croisement arithmétique est utilisé comme opérateur génétique et l’opération de mutation n’est pas utilisée dans cet exemple, la sélection par roulette est appliquée pour chaque génération et le nombre d’itération est 40. Les valeurs expérimentales sont données par le tableau suivant [Asi-10]: 2 C (mg/cm ) Uc 25.4 0.68 0.13 12 27.9 25.4 0.68 0.16 11.1 27.9 25.4 0.68 0.23 8.7 27.9 25.4 0.68 0.34 7.5 27.9 25.4 0.68 0.49 6.2 27.9 25.4 0.68 0.55 6.1 30.5 25.4 0.70 0.02 22 30.5 25.4 0.70 0.05 16 30.5 25.4 0.70 0.1 13 30.5 25.4 0.70 0.16 11 30.5 25.4 0.70 0.22 10 43.2 25.4 0.92 0.05 19 43.2 25.4 0.92 0.1 15 43.2 25.4 0.92 0.16 13 43.2 25.4 0.92 0.22 12 43.2 25.4 0.92 0.3 10.5 43.2 22.9 1.38 0.02 23.5 43.2 22.9 1.38 0.03 20.9 43.2 22.9 1.38 0.04 19.4 43.2 22.9 1.38 0.05 18.3 43.2 22.9 1.38 0.06 16.9 43.2 22.9 1.38 0.1 15.8 43.2 22.9 1.38 0.2 13.6 Type 1 27.9 2 F Type (cm) 3 D Type (cm) 4 L Type Type Où : (KV) Tableau IV.2 L : Longueur de la ligne de fuite D : Diamètre moyen de l’isolateur F : Facteur de forme C : La DDSE ( Densité de Dépôt de Sel Equivalente) Uc : La tension critique de contournement 85 Chapitre IV Applications, résultats et discussions IV.3.4- Application et résultats : L’apprentissage de l’algorithme génétique est fait sur une base de données collectée à partir des publications sur le domaine du contournement des isolateurs pollués [Muh-08] [Gen-08] [Gen-09] [Gon-02] [Kon-06] [Asi-09] [Kaz-08]. Le tableau suivant récapitule cette base de données de 14 modèles d’isolateurs : C U1 U2 U3 U4 U5 U6 U7 U8 U9 U10 U11 U12 U13 U14 (mg/cm ) (x10Kv) (x10Kv) (x10Kv) (x10Kv) (x10Kv) (x10Kv) (x10Kv) (x10Kv) (x10Kv) (x10Kv) (x10Kv) (x10Kv) (x10Kv) (x10Kv) 0.0200 2.3260 2.5516 2.5802 2.2312 2.8191 2.4656 3.1236 2.4823 2.1961 2.3978 2.1099 2.1904 2.5850 2.6287 0.0300 2.0361 2.2377 2.2648 1.9530 2.4741 2.1596 2.7431 2.1744 1.9217 2.1083 1.8446 1.9165 2.2692 2.3111 0.0400 1.8498 2.0357 2.0618 1.7742 2.2520 1.9629 2.4980 1.9765 1.7453 1.9216 1.6742 1.7405 2.0658 2.1064 0.0500 1.7159 1.8904 1.9157 1.6457 2.0922 1.8215 2.3216 1.8342 1.6186 1.7872 1.5518 1.6141 1.9194 1.9590 0.0600 1.6131 1.7788 1.8034 1.5470 1.9693 1.7129 2.1860 1.7249 1.5213 1.6838 1.4579 1.5170 1.8070 1.8456 0.1300 1.2374 1.3702 1.3920 1.1865 1.5194 1.3158 1.6890 1.3253 1.1659 1.3044 1.1151 1.1625 1.3948 1.4295 0.1600 1.1516 1.2766 1.2977 1.1042 1.4163 1.2250 1.5750 1.2339 1.0847 1.2173 1.0369 1.0815 1.3003 1.3340 0.2300 1.0149 1.1276 1.1474 0.9731 1.2520 1.0804 1.3932 1.0884 0.9556 1.0783 0.9125 0.9527 1.1498 1.1816 0.2800 0.9475 1.0539 1.0730 0.9084 1.1708 1.0090 1.3034 1.0165 0.8919 1.0095 0.8512 0.8891 1.0753 1.1061 0.3400 0.8852 0.9858 1.0042 0.8486 1.0956 0.9430 1.2201 0.9501 0.8330 0.9458 0.7945 0.8304 1.0064 1.0363 0.3700 0.8593 0.9575 0.9756 0.8238 1.0643 0.9156 1.1855 0.9225 0.8085 0.9193 0.7710 0.8060 0.9777 1.0072 0.4900 0.7784 0.8689 0.8862 0.7461 0.9665 0.8299 1.0773 0.8362 0.7321 0.8362 0.6975 0.7298 0.8881 0.9162 0.5200 0.7622 0.8512 0.8683 0.7306 0.9470 0.8128 1.0556 0.8190 0.7168 0.8196 0.6828 0.7145 0.8702 0.8980 0.5500 0.7473 0.8348 0.8517 0.7163 0.9289 0.7969 1.0356 0.8030 0.7027 0.8043 0.6692 0.7005 0.8536 0.8811 2 Tableau IV.3 Types d’isolateurs : Dm (cm) L (cm) F 1 2 3 4 5 6 7 8 9 10 11 12 13 14 26.8 26.8 25.4 25.4 29.2 27.9 32.1 28 25.4 20 25.4 25.4 25.4 22.9 33 40.6 43.2 31.8 47 36.8 54.6 37 30.5 40 27.9 30.5 43.2 43.2 0.79 0.86 0.9 0.72 0.76 0.96 0.8 0.74 1.29 0.68 0.70 0.92 1.38 0.92 Tableau IV.4 86 Chapitre IV Applications, résultats et discussions L’application donne les résultats de « A » et « n » suivants : Génération La constante « A » La constante « n » 1 134.8184 0.3238 2 137.9150 0.3101 3 127.5301 0.3959 4 130.8851 0.3470 5 126.0758 0.3955 6 130.1165 0.3418 7 131.2313 0.3472 8 133.1253 0.3395 9 131.5862 0.3455 10 131.0845 0.3540 14 133.1144 0.3382 17 131.9228 0.3479 20 131.9534 0.3474 23 131.9510 0.3475 26 131.9303 0.3474 29 131.9243 0.3475 33 131.9237 0.3474 35 131.9240 0.3474 39 131.9237 0.3474 40 131.9237 0.3474 Tableau IV.5 D’après ce tableau on constate que pour les premières générations le choix des constantes n’est pas bon mais à partir de la 10ème génération on a constaté une petite stabilité de l’algorithme génétique et le choix des constantes devient plus proche du réel et à partir de la 20ème génération les populations sont presque identiques d’où les mêmes valeurs de A et n La meilleure solution pour ce problème est obtenue à la 39ième itération qui correspond à A =131.9237 et n= 0,3474. 87 Chapitre IV Applications, résultats et discussions La figure (IV-2) donne une idée sur la convergence de l’algorithme génétique : La constante "A" 140 135 130 125 0 5 10 0 5 10 15 20 25 Générations A=131.9237 ; n=0.3474 30 35 40 30 35 40 La constante "n" 0.4 0.38 0.36 0.34 0.32 15 20 Générations 25 Figure IV-2 : convergence des constantes de l’arc IV.3.4.1- Validation: L’apprentissage de l’algorithme génétique est fait à l’aide des valeurs du tableau (IV.3) , qu’on peut représenter sous forme de courbes, et bien sûr si on applique les valeurs des constantes de l’arc « A » et « n » à l’équation du model mathématique on peut aussi tracer des courbes à partir des données de ce tableau. Si on trouve une bonne concordance entre les courbes on peut conclure que l’apprentissage a réussi. On a choisit à titre d’exemple 4 types d’isolateurs (1,5,7,11).La figure (IV-3) montre que les courbes des valeurs empiriques et celle estimées par l’AG sont presque identiques. D’où la réussite de l’application de l’AG. 88 Chapitre IV Applications, résultats et discussions x 10 4 Type1 estimation AG Type1 Relation empirique Type5 estimation AG Type5 Relation empirique Type7 estimation AG Type7 Relation empirique Type11 estimation AG Type11 Relation empirique 3 2.5 Uc (V) 2 1.5 1 0.5 0 0 0.1 0.2 0.3 0.4 0.5 0.6 La DDSE "C" (mg/cm²) Figure IV-3 : La tension critique en fonction de la DDSE On procède maintenant à une autre vérification, on va exposer notre modèle proposé aux valeurs expérimentales du tableau (IV.2), ces valeurs n’ont pas été utilisées dans l’apprentissage, et en plus on va faire une comparaison au modèle de I F Gonos qui est une référence dans ce domaine, on trouve la figure (IV-4): 4 3 Validation par les valeurs exp et le model de I F Gonos x 10 Type1 Model Type1 Exp Type2 Model Type2 Exp Type3 Model Type3 Exp Type4 Model Type4 Exp Type1 Model Type2 Model Type3 Model Type4 Model 2.5 Model proposé: A=131.9237 ; n=0.3474 Uc (x10Kv) 2 Gonos Gonos Gonos Gonos proposé proposé proposé proposé 1.5 1 0.5 0 0 0.1 0.2 0.3 0.4 0.5 0.6 La DDSE en mg/cm 2 Figure IV-4 : Comparaison entre les valeurs données par le modèle proposé par I F Gonos et les valeurs données avec A=131.9237 et n=0,3474 89 Chapitre IV Applications, résultats et discussions On constate que le model proposé est en parfaite concordance avec celui de Gonos dans plusieurs points, il donne une estimation moins précise dans d’autres points, et dans le reste des points il donne une estimation meilleure. Donc on peut dire que l’application des algorithmes génétiques pour la détermination des constantes de l’arc donne de bons résultats et est efficace dans ce genre de problèmes. IV.4- Réseaux de neurones : IV.4-1 L’algorithme RNA : (algorithme réseaux de neurones) Le RNA peut utiliser des données lues pour modéliser certains problèmes avec une grande précision. Ce modèle peut être utilisé pour estimer des variables de sorties à partir des données des variables d’entrées. Le RNA essaye de simuler le processus de raisonnement de l’intelligence humaine et donc être utilisé au lieu des fonctions mathématiques. Le RNA peut avoir trois types de couches, la couche des entrées, une ou plusieurs couches cachées et la couche des sorties. Pour créer le RNA, la première des choses est de décider sur le nombre des neurones dans chaque couche. Le RNA est généralement établi avec un algorithme de rétropropagation de l’erreur où l’erreur qui arrive au niveau de la couche de sortie retourne à la couche des entrées pour modifier les poids. Cette procédure se répète jusqu’à atteindre des valeurs d’erreurs acceptables. Dans ce présent travail un RNA adapté est construit en Matlab et établi pour estimer la tension de contournement d’un isolateur suivant ces caractéristiques. La variable qui est donnée comme entrée est : C : DDSE en mg/cm2 Pendant que la variable de sortie est la tension de contournement Uc (en kv). La figure (IV-5) présente les grandes lignes du processus de construction de le RNA adapté. 90 Chapitre IV Applications, résultats et discussions Début Sélection de N variables d’entrées à partir de la base de données Normalisation des variables d’entrées Combinaison pour l’optimisation du nombre de neurones, valeurs initiales et paramètre du temps de période du terme momentané et vitesse de dressement Mode de calcul qu’utilise l’algorithme de propagation en retour Modèle d’évaluation Fin de combinaison Non Oui Modèle d’évaluation fin Figure IV-5 : Les grandes lignes du processus de construction de l’ANN adapté. 91 Chapitre IV Applications, résultats et discussions Les données entrées-sorties sont normalisées avant l’apprentissage du réseau pour assurer une bonne convergence et la précision lors du procédé d’entraînement [Far-97]. Nous avons essayé neuf différents arrangements pour normaliser les modèles d’entraînement entrée-sortie. Les détails concernant ces arrangements de normalisation sont discutés [Bel-09]. Ces différents arrangements pour la normalisation utilisant les valeurs de maximum et minimum des données ; les composantes des vecteurs de sortie et aussi la valeur moyenne et la variance standard (standard déviation) S.D des variables entrée-sortie sont présentés dans le tableau suivant : Numéro de Entrée Sortie 1 Max Max 2 Max Max Min 3 Max Mean & S.D 4 Max Min Max 5 Max Min Max Min 6 Max Min Mean & S.D 7 Mean & S.D Max 8 Mean & S.D Max Min 9 Mean & S.D Mean & S.D l’arrangement Tableau IV.6 IV.4.2- Réseaux de neurones artificiels : Une fois les poids de connexion sont ajustés par l’algorithme adapté de rétropropagation, le RNA peut estimer la tension de contournement des expériences. Trois points doivent être notés : - Critères d’arrêt : Le calcul est répété par époque (une époque est la représentation de groupe d’expériences, entrées et objectifs, vecteurs du réseau et le calcul des nouveaux poids) jusqu’à ce que les poids soient stabilisés ou les fonctions d’erreurs ne sont pas encore minimisées ou le nombre maximal des époques est atteint. 92 Chapitre IV Applications, résultats et discussions Dans notre cas la fonction d’erreur est la racine carrée de l’erreur moyenne du groupe d’évaluation conforme à RMSEva m q 2 out 1 e2 ( i ) m2 qout i =1 k =1 k ‡”‡” RMSEVA = (IV-14) Où qout est le nombre de neurone de la couche de sortie et ek(i) est l’erreur du kième neurone de sortie pour le ième échantillon du groupe d’évaluation. Si l’un des trois critères est vrais, le cœur principal de l’algorithme de rétropropagation tend vers la fin autrement le nombre d’époques est augmenté par 1, les règles d’adaptation sont appliquées et le calcul est répété. - Critères de validation : Pour l’ensemble d’évaluation, la racine carrée de l’erreur moyenne RMSEva, le carré de l’erreur absolue moyenne MAEva, et la corrélation Rva2 peuvent être calculées. m ‡” 2 t ( i )o i =1 k MAEVA ( k ) = 100%. k m2 ( i ) / tk ( i ) (IV-15) Où tk(i) et ok(i) sont la valeur réelle et estimée du kème neurone de sortie pour le ième échantillon de l’ensemble d’évaluation. La corrélation R² est définie par : 2 RVA (k ) m2 i 1 (Ok (i ) t k ) 2 (IV-16) m2 ‡” (t i 1 k (i ) t k ) 2 Où t k est la valeur moyenne respective de tk(i) Pour l’estimation finale de la tension de contournement les équations (IV-14) et (IV-16) peuvent être appliquées - Fonctions d’activation : Un nombre de fonctions d’activation, appelées fonction de transfert, peut être appliqué. La fonction « logsig » (sigmoïde), la fonction « tansig » (hyperbolique) et la fonction « purelin » (linéaire). 93 Chapitre IV Applications, résultats et discussions IV.4.3- Application des RNA pour l’estimation de la tension de contournement d’un isolateur pollué : En utilisant les 14 types d’isolateurs comme en algorithme génétique, on a utilisé le model mathématique pour faire entrer 168 valeurs pour l’apprentissage (entraînement) et 28 valeurs pour le test. Et on a choisit en premier la fonction hyperbolique comme fonction d’activation, α=0.3, η=0.9, une seule couche cachée, et le nombre d’itérations 500. On a varié le numéro de l’arrangement et le nombre de couches, la RMSE a prit les valeurs de la figure (IV-6) : 1.6 1.4 1.2 3.5 RMSE (kV) 3 1 2.5 2 0.8 1.5 1 0.6 0.5 10 0 8 0 5 6 10 Nom 15 bre d 4 20 25 e ne uron es 2 30 35 40 sa Le n ge rr a me S nts 0.4 0.2 0 Figure IV-6 : RMSE pour une couche cachée La fig IV-6 montre que le nombre de neurones et le numéro de l’arrangement ont une grande influence sur la RMSE et en plus la variation de l’erreur en fonction de ces deux paramètres n’est pas linéaire, donc il fallait trouver la meilleur combinaison qui donne la plus petite erreur. Les meilleurs résultats sont donnés pour l’arrangement numéro 8 et le nombre de neurones est entre 25 et 40 mais on prend le nombre 27 qui correspond à la meilleure MAE comme le montre la figure (IV-7). Cette figure montre aussi que la variation de la MAE en fonction du nombre de neurones n’est pas linéaire. 94 Chapitre IV Applications, résultats et discussions 10 9 8 RMSE(kV), MAE(%) 7 6 5 4 3 2 1 0 -1 0 5 10 15 20 25 Nombre de neurones 30 35 40 Figure IV-7 : La RMSE et la MAE en fonction du nombre de neurones Après on a essayé avec deux couches cachées tout en gardant α=0.3 , η=0.9 et les itérations 500, mais en changeant la fonction d’activation à la fonction sigmoïde (logsig), en fixant le numéro de l’arrangement à 8 et en variant le nombre de neurones dans la première et la deuxième couche cachée, les valeurs de la RMSE sont données par la figure (IV-8): 1.1 1 0.9 2 1.8 0.8 1.6 0.7 1.4 RMSE (kV) 1.2 0.6 1 0.5 0.8 0.6 0.4 0.4 0.2 3 Nom bre d e 0.3 4 0 5 5 6 10 neur ones d 7 8 15 ans la 9 2eme co uche 20 caché e 10 re mb No de s la dan nes o r neu 1ere che cou hée cac 0.2 0.1 Figure IV-8 : La RMSE pour 2 couches cachées 95 Chapitre IV Applications, résultats et discussions Même remarque la variation de la RMSE n’est pas linéaire donc il faut choisir la meilleure combinaison avec soin, car on peut constater que pour un nombre plus grand de neurones on peut trouver une erreur plus petite, comme on peut trouver une erreur plus grande. Le meilleur résultat est donné pour 8 neurones dans la 1ère couche cachée et 11 neurones pour la 2ème couche cachée où la RMSE=4.10-3 kV. La corrélation entre les valeurs réelles et les valeurs estimées, pour cette RMSE, est donnée par les figures (IV-9, IV-10). Etudier la corrélation entre deux ou plusieurs variables aléatoires ou statistiques numériques, c’est étudier l’intensité de la liaison qui peut exister entre ces variables. La liaison recherchée est une relation affine. Dans le cas de deux variables numériques, il s'agit de la régression linéaire. Une mesure de cette corrélation est obtenue par le calcul du coefficient de corrélation linéaire. Ce coefficient est égal au rapport de leur covariance et du produit non nul de leurs écarts types. Le coefficient de corrélation est compris entre -1 et 1. En faisant en sorte que l'erreur que l'on commet en représentant la liaison entre nos variables par une droite soit la plus petite possible. Le critère formel le plus souvent utilisé, est de minimiser la somme de toutes les erreurs effectivement commises au carré. On parle alors d'ajustement selon la méthode des moindres carrés ordinaires. La droite résultant de cet ajustement s'appelle une droite de régression. Le coefficient de corrélation est égal à 1 dans le cas où l'une des variables est fonction affine croissante de l'autre variable, à -1 dans le cas où la fonction affine est décroissante. Les valeurs intermédiaires renseignent sur le degré de dépendance linéaire entre les deux variables. Plus le coefficient est proche des valeurs extrêmes 1 et -1, plus la corrélation entre les variables est forte (Fig IV-9 ); on emploie simplement l'expression « fortement corrélées » pour qualifier les deux variables. En revanche, ce coefficient de corrélation est extrêmement sensible à la présence de valeurs aberrantes ou extrêmes (ces valeurs sont appelées des "déviants") dans notre ensemble de données (Fig IV-10 ) (valeurs très éloignées de la majorité des autres, pouvant être considérées comme des exceptions). 96 Chapitre IV Applications, résultats et discussions 4 3 x 10 R2=0.99999 Valeurs estimées 2.5 2 1.5 1 0.5 0.5 1 1.5 2 Valeurs réelles 2.5 3 4 x 10 -3 Figure IV-9 : La corrélation pour les valeurs de l’apprentissage (RMSE=4.10 kV) 4 2.6 x 10 R2=0.99866 2.4 2.2 Valeurs estimées 2 1.8 1.6 1.4 1.2 1 0.8 0.6 0.6 0.8 1 1.2 1.4 1.6 1.8 Valeurs réelles 2 2.2 2.4 2.6 4 x 10 -3 Figure IV-10 : La corrélation pour les valeurs de test (RMSE=4.10 kV) 97 Chapitre IV Applications, résultats et discussions Après on a fixé le nombre de neurones à 8 pour la 1ère couche cachée et 11 pour la 2ème couche cachée et on a fait changer le nombre d’itérations on a trouvé les RMSE de la figure (IV-11): 0.05 0.045 0.04 RMSE (kV) 0.035 0.03 0.025 0.02 0.015 0.01 0.005 0 0 1000 2000 3000 Itérations 4000 5000 6000 Figure IV-11 : La RMSE en fonction des itérations On constate que 6000 itérations donnent une bonne valeur de la RMSE (3.10-4kV). En fin on a changé la fonction d’activation pour le dernier cas c-à-d α=0.3,η=0.9, S=8, 8 neurones dans la 1ère couche et 11 neurones dans la 2ème couche et 6000 itérations on a trouvé le tableau suivant qui donne la RMSE (kV) en fonction des différentes combinaisons des fonctions d’activations : La fonction d’activation pour les couches cachées La Logsig Tansig Purelin 0.0083 0.04 0.002 Tansig 0.003 0.192 0.0028 Purelin 0.0003 0.012 0.0027 fonction Logsig d’activation pour la couche de sortie Tableau IV.7 On constate que la fonction logsig pour les couches cachées et la fonction purelin (linéaire) pour la couche de sortie donne le meilleur résultat. 98 Chapitre IV Applications, résultats et discussions Après on a fait une petite analyse statistique des résultats obtenus en fonction de l’intervalle de confiance à 95% et les valeurs expérimentales on a trouvé les résultats de la figure (IV-12): Un intervalle de confiance est un outil permettant d'exprimer notre degré de certitude à propos des paramètres d'un modèle statistique [Asi-09]. L'estimation de la moyenne d’un échantillon µ par intervalle de confiance est couramment utilisée en pratique. Elle augmente le niveau d'information par rapport à une estimation ponctuelle. Elle permet d'avoir un aperçu des valeurs possibles pour µ. Un intervalle de confiance à 100(1-α)% pour µ consiste à trouver deux bornes, inférieur et supérieur, qui dépendent de l'échantillon tiré. Si on tire un grand nombre de fois un échantillon et si pour chacun on calcule l'intervalle de confiance, alors dans 100(1-α)% des cas le paramètre µ devrait être dans l'intervalle de confiance. Dans notre cas si on prend α=0.05 on aura 95% de chance que la valeur estimée des mesures effectuées soit à l’intérieur de l’intervalle. 3 x 10 4 valeurs expérimentales intervalle de confiance valeurs estimées 2.5 Uc (kV) 2 1.5 1 0.5 0 5 10 15 20 L'ensemble des cas étudiés expérimentalement 25 Figure IV-12 : Situation des valeurs expérimentales et estimées par le RNA par rapport à l’intervalle de confiance On constate que toutes les valeurs estimées par le RNA sont à l’intérieur des intervalles de confiances des mesures. On a remarqué aussi que la largeur des 99 Chapitre IV Applications, résultats et discussions intervalles n’est pas la même pour toutes les mesures, cela est dû aux valeurs récoltées, s’ils sont proches l’intervalle sera étroit si non il sera large. En suite on a fait une petite comparaison avec le model mathématique proposé par Gonos en fonction des valeurs expérimentales (Fig IV-13 , IV-14). 4 x 10 3 experimentale Model mathéma Estimée par RNA 2.5 2 1.5 Uc (kV) 1 0.5 0 0 5 10 15 20 25 30 Les cas étudiés expérimentalement Figure IV-13 : Comparaison entre les valeurs du modèle mathématique et celles du RNA en prenant les valeurs expérimentales comme référence 0.18 Model mathématique Estimation RNA L’erreur relative (%) 0.16 0.14 0.12 0.1 0.08 0.06 0.04 0.02 0 0 5 10 15 20 25 30 Les cas étudiés expérimentalement Figure IV-14 : Comparaison entre l’erreur relative du modèle mathématique et celle du RNA par rapport aux valeurs expérimentales 100 Chapitre IV Applications, résultats et discussions On constate que les valeurs estimées par le RNA sont meilleurs que celle du model mathématique pour la plupart des cas (16 sur 28 cas) et donc on peut dire que le RNA est une bonne méthode pour estimer la tension de contournement. IV.5- Conclusion : Deux technique de l’intelligence artificielle ont été utilisées dans ce chapitre, la première est l’algorithme génétique et a été utilisée pour déterminer les constantes de l’arc « A» et « n », la deuxième est les réseaux de neurones artificiels où on a utilisé les valeurs des constantes trouvées par la première méthode pour construire la base de donnée pour l’apprentissage du RNA afin d’estimer la tension de contournement d’un isolateur HT pollué. La validité des résultats obtenus montre que ces méthodes ont été appliquées avec succès et que leur utilisation dans ce domaine peut donner un plus aux recherches visant à limiter le défaut du contournement et améliorer le bon fonctionnement des isolateurs dans le domaine de la haute tension. 101 Conclusion générale Conclusion générale Travail accompli L’exposition du matériel isolant à des différentes conditions environnementales est inévitable dans tous les systèmes énergétiques. Donc ils sont le siège de dépôt de pollution, cette contrainte est reconnue comme étant le facteur majeur à l’origine des défauts enregistrés sur les lignes aériennes. La coexistence du duo, la pollution (naturelle et/ou industrielle) et l’humidité (rosée, brouillard ou la pluie) est une condition défavorable à l’isolateur. La présence de particules électrolytes avec l’humidité peut former un film fin avec conductibilité élevée sur la surface de l’isolateur. Cette couche réduit la résistance de la surface et conduit à un courant de fuite. Le résultat de ce courant est l’échauffement ohmique de la surface et création d’une bande sèche, cette dernière une fois formée, des décharges partielles peuvent apparaître et si la tension et le courant de fuite arrivent à une certaine valeur critique, le phénomène de contournement peut apparaître. La compréhension de ce phénomène est d’un intérêt majeur pour sa réduction. Plusieurs travaux ont essayé de modéliser ce phénomène notamment le modèle mathématique proposé par Obenaus qui se base sur une décharge de longueur x en série avec une résistance R(x) caractérisant la couche polluante. Ce model présente quelques lacunes notamment les deux constantes A et n qui n’ont pas jusqu'à aujourd’hui des valeurs bien précises. Le développement de l’outil informatique à permet aux méthodes numériques de prendre leurs places dans ce domaine d’investigations, notamment les AG et les RNA L’AG a été utilisé dans ce travail principalement pour la détermination des constantes de l’arc en ce basant sur le model d’Obenaus et les valeurs expérimentales de la tension de contournement. Les valeurs des constantes ainsi déterminées ont été utilisées pour construire une base de données pour l’apprentissage des RNA. L’application des RNA a donnée des résultats très suffisants comme le montre l’analyse statistique réalisée à la fin du travail. Donc on peut dire que les systèmes intelligents peuvent remplacer avec efficacité les travaux expérimentaux coûteux et exigeants en temps et en matériel 103 Conclusion générale Difficultés rencontrées et remarques Le manque de données expérimentales qui donnent la tension de contournement en fonction de la densité équivalente de sel (DDSE) nous a obligé de se baser sur le model mathématique et faire recoure aux AG pour la détermination des constantes de l’arc, pour la construction d’une base de données suffisante au bon apprentissage des RNA. Perspectives et suggestions Le model numérique est très efficace dans ce genre de problème mais il nécessite une base de données importante issue des expériences, donc il faut élargir le travail expérimental pour tout les types d’isolateurs. L’intelligence artificielle est un domaine vaste, dans ce travail on a utilisé deux techniques seulement, peut être que d’autres techniques seront plus précises et plus puissantes, pour ceux qui veulent travailler sur ce domaine on espère que notre travail leur serait utile pour continuer la recherche. 104 Bibliographie Bibliographie BIBLIOGRAPHIE [Als-63] Alston,L.L. and Zoledziowski, S., "Growth of Discharges on Polluted Insulation", lEE, Vol. 110, No. 7, pp.1260-1266, July 1963. [Asi-09] G.E. Asimakopoulou V.T. Kontargyri G.J. TsekourasF.E. Asimakopoulou I.F. Gonos I.A. Stathopulos “Artificial neural network optimisation methodology for the estimation of the critical flashover voltage on insulators” National Technical University of Athens, Published in IET Science, pp 90-104, 2009. [Asi-10] G.E. Asimakopoulou V.T. Kontargyri G.J. Tsekouras, Ch.N. Elias F.E. Asimakopoulou, I.A. Stathopulos “A fuzzy logic optimization methodology for the estimation of the critical flashover voltage on insulators” National Technical University of Athens, Published in IET Science, pp 580-588, 2010. [Bac-96] T. Back, “Evolutionary Algorithms in Theory and Practice”: Evolution Strategies, Evolutionary Programming, Genetic Algorithms (Hardcover), Oxford University Press, USA, 1996 [Bag-70] Al-Baghdadi, A., "The Mechanism of Flashover on Polluted Insulators",Thesis of PhD, University of Manchester, USA, pp. 67, 1970. [Bel-09] M. Belkheiri,B. Zegnini, and D. Mahi “Modeling the Critical Flashover Voltage of High Voltage Insulators Using Artificial Intelligence” Journal of Intelligent Computing and Application (JICA), pp137154, decembre 2009. [Cha-03] Rabah CHAARANI ” Etude de l’influence des caractéristiques des isolateurs sur leurs performance électriques dans des conditions de givrage” thèse doctorat, Université du QUÉBEC, 2003 [Far-97] A.S. Farag , “Estimation of Polluted Insulators Flashover Time Using Artificial Neural Networks” King Fahd University of Petroleum and Minerals IEEE,pp. 184-192, 1997 [Fla-87] S. Flazi “Etude du contournement électrique des isolateurs haute tension pollués, critère d’élongation de la décharge et dynamique du phénomène” Thèse Doctorat d’état , Toulouse, France, 1987. [Fla-07] S. Flazi, A. Ouis and N. Boukhennoufa “Resistance of Pollution in Equivalent Electric Circuit of Flashover” IET Gener,pp. 183-188, January 2007 [Fog-66] L. Fogel., A.J. Owens, M.J. Walsh, “Artificial Intelligence through Simulated Evolution”, Wiley, Chichester, UK, 1966 [Gen-08] M.T. Gencoglu, M. Cebeci “Computation of AC Flashover Voltage of Polluted HV insulators using a dynamic arc model” Euro.Trans.Electr.Power, pp689-701,2008. [Gen-09] M.T. Gencoglu, M. Cebeci “Investigation of Pollution Flashover on High Voltage Insulators Using Artificial Neural Network” ScienceDirect , pp7338-7345,2009. [Gho-95] P. S. Ghosh and N. Chatterjee “Polluted Insulator Flashover Model for AC Voltage”University, Calcutta, India.IEEE,vol2, pp.128-136, 1995 [Gon-02] I.F. Gonos, F.V. Topalis and LA. Stathopolos “Genetic Algorithm Approach to the Modelling of Polluted Insulators” IEE,pp. 373-376, May 2002 [Gop.S-84] S. Gopal, M.E., and Prof. Y.N. Rao, Dr.-Ing.“ Flashover Phenomena of Polluted Insulators” IEE,pp. 140-143, Jully 1984 [Gop.E-07] E.S. Gopi “Algorithm Collections for Digital Signal Processing Applications Using Matlab” Springer, 2007 [Gro-73] Grossberg, S. “Contour Enhancement, Short Term Memory, and Constancies in Reverberating Neural Networks”. Studies in Applied Mathematics,pp. 213–257,1973 [Gro-88] Grossberg, S. “Nonlinear neural networks: principles, mechanisms, and architectures”. Neural Networks, pp 17–61, 1988. [Ham-64] Hampton, B. F., "Flashover Mechanism of Polluted Insulation", IEE, Vol. 11, No. 5, pp. 985990, 1964. [Hau-04] R. L. Haupt, S. E Haupt. Practical Genetic Algorithms, 2nd edition, John Wiley & Sons edition, New York, USA, 2004 106 Bibliographie [Heb-49] Hebb, D. “The Organization of Behavior”. Wiley, New York.1949. [Hes-67] Hesketh, S., "General Criterion for the Prediction of Pollution Flashover", IEE, Vol. 114, No. 4, pp. 531-532, 1967. [Hol-75] J.H. Holland, “Adaptation Michigan Press, USA, 1975 in Natural and Artificial Systems, Ann Arbor”: The University of [Hub-77] Hubel, D. and Wiesel, T. " Functional Architecture of Macaque Monkey Visual cortex”. Biol. Sci,pp. 1–59,1977. [IEC-93] International Electrotechnical Commission (IEC), "Artificial Pollution Tests on High-voltage Insulators to be Used on D.C. Systems", Technical Report 1245, 1993. [Jol-72] Jolly, D. C, "Contamination Flashover, Part I: Theoretical Aspects", IEEE, PAS-91, pp. 24372442,1972. [Jol-74] Jolly, D. C, Cheng, T. C. and Often, D. M., "Dynamic Theory of Discharge Growth over Contaminated Insulator Surfaces", IEEE, New York, USA, Paper, No. C74 068-3, 1974. [Kaz-08] A. Kazemi, M.T.Hassanzadeh and A.Gholami “Artificial Neural Network for Insulator Leakage Currents Prediction from Environmental Data” IEEE International Conference on Power and Energy, Malaysia , pp. 13-17,2008 [Kim-07] S. D. Kimbakala « Modélisation dynamique des décharges se propagent sur des surfaces isolantes polluées avec des dépôts discontinues sous différentes formes de tension » Thèse de Doctorat, Ecole doctorale de Lyon, 2007 [Knu-79] Knudsen, E. and Konishi, M. “Mechanisms of Sound Localization in the Barn Owl (tyto alba)”. Journal of Compartive Physiology, pp13–21,1979. [Koh-84] Kohonen, T.“Self-Organization and Associative Memory”.Springer Verlag, New York.1984 [Koh-93] Kohonen, T. “Physiological Interpretation of the Self-organizing Map Algorithm”. Neural Networks, pp. 895–905.1993. [Kon-06] V.T. Kontargyri, A.A. Gialketsi, G.J. Tsekouras,I.F. Gonos, I.A. Stathopulos “Design of an Artificial Neural Network for the Estimation of the Flashover Voltage on Insulators” National Technical University of Athens, pp. 1532-1540, December 2006. [Kuf-00] E. Kuffel, W.S. Zaengl, J. Kuffel “High Voltage Engineering Fundamentals” Second edition, published by Butterworth-Heinemann, 2000 [Li-88] Li, S., "The Mechanism of the Flashover on a Polluted Dielectric Surfaceunder AC Voltage", Thesis of PhD, Tsinghua University, China, 1988. [Lip-87] Lippman, R. “An introduction to computing with neural nets”. IEEE ASSP Magazine, pp. 4– 22,1987. [Mer-82] Mercure, H. P. and Drouet, M. G., "Dynamic Measurement of the Current Distribution in the Foot of an Arc Propagation Along the Surface of an Electrolyte", IEEE, Vol.PAS-101, No. 3, pp. 725-736, 1982. [Muh-08] Muhsin Tunay Gencoglu, Mehmet Cebeci “The Pollution Flashover on High Voltage Insulators”, ScienceDirect, pp. 1914-1921, 2008 [Obe-58] Obenaus F., «Fremdshichtuberschlag und Kriechweglang», « Deutch Elektrotechnick », Vol. 4, P. 135-136, 1958. [Pir-96] M. Pirlot, A General local search method, European Journal of Operational Research, vol. 92, No. 3, pp. 493-511, 1996. [Rec-65] I. Rechenberg, “Cybernetic Solution Path of an Experimental Problem”, Royal Aircraft Establishment Library Translation, Farnborough, U.K, 1965 [Riz-81] Rizk, Farouk A. M., "Mathematical Models for Pollution Flashover ",electra vol.78, pp. 71-103, 1981 [Ros-62] Rosenblatt, F.” Principles of Neurodynamics”. Spartan Books,New York,1962. [Ros-92] Rosenzweig, M. and Leiman, A. “Psychophysiologie”. Interéditions, 2 ème Electra,Vol. 78, pp. 71-103, 1981.édition,1992. 107 Bibliographie [Roy-84] Le Roy et Cie, ‘’Les propriétés diélectriques de l'air et les très hautes tensions’’, Collection de la direction des études et recherches d'électricité de France, Paris 1984. [Rum-85] Rumelhart, D. and Zipser, D. ’’Feature discovery by competitive learning’’. cognitive Science,pp 75–112,1985 [Sah-10] Z. Sahli, et al. « Prediction parameters of dimensioning of insulators under non-uniform contaminated conditions by multiple regression analysis », Electr. Power Syst. Res. (2010), doi:10.1016/j.epsr.2010.11.017 [Sla-02] M. El-A. Slama “Contribution à l’étude de l’influence de la non-uniformité de la distribution de la pollution basée sur la méthode de la DDSE pour le dimensionnement des isolateurs des lignes THT à courant alternatif ” mémoire de Magister électrotechnique Université USTOMB , 2002 [Sla-10] M. El-A. Slama, A. Beroual, and H. Hadi ‘’Analytical Computation of Discharge Characteristic Constants and Critical Parameters of Flashover of Polluted Insulators ’’ IEEE, pp1764-1771, Jully 2010. [Voi-04] S. Voisin, Application des Algorithmes Génétiques à l’estimation de mouvement par modélisation markovienne, Rapport DEA, Université Joseph Fourier, CNRS, France, 2004. [Wan-08] Wang Haiyan, liu Gang “Study on Insulator Natural Contamination Trend under Different Physiognomies of Local Area” , University of Technology, Guangzhou, China, IEEE, pp. 89-93, 2008 [Whi-93] D. Whitley, Foundations of Genetic Algorithms 2, US Edition, California, USA, 1993 [Zeg-07] B. Zegnini “ Etude du phénomène de contournement des surfaces contaminées sous tension alternative : application à l’étude de la tenue des isolateurs HT dans leur environnement naturel ” Thèse doctorat Es Sciences en électrotechnique option : matériaux isolants , USTOMB ,13 mars 2007 [Zha-91] Zhang, J., "Study on Flashover Mechanism and Affecting Factors of Polluted insulators", Thesis of PhD, Chongqing University, China, 1991. [Zha-00] J. Zhang and M. Farzaneh ‘’Propagation of AC and DC Arcs on Ice Surfaces’’, IEEE, vol7, pp. 269-276, 2000. [Zol-66] Zoledziowski, S., "Time-to-Flashover Characteristics of Pollted Insulators" ,IEEE, Vol. PAS-87, No.6, pp. 1397-1404, 1966.282 108