Université de Bourgogne Institut de Mathématiques de Bourgogne Université de Toulouse École Nationale Supérieure d’Électrotechnique Électronique, Informatique, Hydraulique et Télécom Institut de Recherche en Informatique de Toulouse Problème des trois corps restreint, contrôle en temps minimum J.-B. Caillau B. Daoud et J. Gergaud Parallel Algorithms and Optimization Team ENSEEIHT–IRIT (UMR CNRS 5505) 2 rue Camichel, F-31071 Toulouse apo.enseeiht.fr Technical Report RT/APO/09/03 Problème des trois corps restreint, contrôle en temps minimum∗ J.-B. Caillau†, B. Daoud‡ et J. Gergaud§ Octobre 2009 1 introduction On se propose d’étudier le mouvement d’un engin spatial soumis à l’attraction de deux planètes. On traitera le cas particulier d’un satellite soumis à l’attraction de la Terre et de Lune. L’exemple le plus connu est celui de la mission SMART1 de l’ESA. On se propose de réaliser des transferts TerreLune, l’orbite initiale étant une orbite autour de la Terre et la finale autour de la Lune. Le but de notre étude est de déterminer la commande du moteur de l’engin spatial à chaque instant du transfert. L’introduction de critères de minimisation, à savoir le temps minimal et la masse maximale, nous ramène à un problème classique de contrôle optimal. On utilise, pour la résolution de tels problèmes, des méthodes dites indirectes basées sur le principe de maximum de Pontryagin[6, 8]. D’autre part, les méthodes directes sont basées sur une dicrétisation partielle (contrôle) ou totale (contrôle et état) du problème et utilisent différentes approches pour résoudre le problème d’optimisation. Ces méthodes connues pour leur robustesse présentent une basse précision et un problème d’optimisation avec un grand nombre d’équations dépendant du pas de dicrétisation. Par conséquent, les méthodes directes sont mal-adaptées pour des cas particuliers tels que les problèmes à contrôle bang-bang. On montrera ultérieurement que le contrôle pour le transfert Terre-Lune avec maximisation de la masse est bang-bang. On s’intéresse dans notre étude aux méthodes indirectes. Le système {Terre, Lune, Satellite} est un problème à 3 corps. C’est un cas particulier du problème des N corps, un probléme célébre de mécanique. Il s’agit d’étudier le mouvement de N points massiques soumis à l’influence de leur attractions gravitationnelles mutuelles. Ce problème est d’un grand intérêt d’un point de vue pratique (étude du système solaire, du système Terre-Lune (notre cas), etc...). ∗ Rapport de première année de thèse financée par une allocation ministérielle fléchée de Mathématiques, Université de Bourgogne, BP 47870, F-21078 Dijon ([email protected]). ‡ Institut de Mathématiques, Université de Bourgogne, BP 47870, F-21078 Dijon ([email protected]). § ENSEEIHT-IRIT (UMR CNRS 5505), 2 rue Camichel, F-31071 Toulouse ([email protected]). † Institut 1 2 ÉQUATIONS DU MOUVEMENT 2 Pour N = 2, on parle du problème de Kepler. Grâce à un nombre suffisant d’intégrales premières, ce problème se résout analytiquement : toutes les solutions sont des ellipses, paraboles ou des hyperboles dans un repère rattaché à l’un des deux corps. Le cas N = 3 (notre cas) est d’une plus grande difficulté. Pour faciliter notre tâche, on commence par étudier un problème plus simple le CR3BP (Circular Restricted Three Bodies Problem) défini comme suit par Victor Szebehely [7] "Deux corps décrivent des orbites circulaires autour de leur centre de masse sous l’influence de leur attraction gravitationnelle mutuelle, et un troisième corps (attiré par les deux précédents mais sans influence sur leur mouvement) se déplace dans le plan défini par les deux corps en rotation. Le problème restreint consiste à décrire le mouvement de ce troisième corps.". Cette définition est remplie en rajoutant au problème des 3 corps des hypothèses simplificatrices correspondantes à notre cas particulier : – On suppose que le troisième corps M 3 n’influence pas les corps M 1 et M 2, dont le mouvement est donné comme une solution du problème de Kepler. Ceci revient à prendre nulle la masse de M 3 dans les équations de mouvements de M 1 et M 2 ; l’accélération de M 3 ne dépend pas de la masse de M 3. Cette approximation est pertinente étant donné que la masse du satellite est négligeable par rapport à celles de la Terre et de la Lune (Msatellite ∼ 103 << MLune ∼ 1022 et MT erre ∼ 1024 ). – Un mouvement particulier est choisi pour M 1 et M 2 : ces deux corps décrivent une trajectoire circulaire autour de leur centre de masse. L’orbite de la Lune autour de la Terre possède une excentricté de 0.0549 , ce qui est assez proche d’une orbite circulaire. – On suppose que le mouvement de M 3 (le satellite) est restreint au plan orbital de M 1 (Terre) et M 2 (Lune). Le problème restreint circulaire des trois corps (CR3BP) est d’un intérêt important car il présente une première approximation utile de beaucoup de problèmes réels. C’est aussi le cas particulier le plus simple non intégrable du problème des N corps. 2 Équations du mouvement On considère un satellite soumis à l’attraction de la Terre et de la Lune. On note T~ la force motrice de l’engin du satellite. L’application du principe fondamental de la dynamique au satellite dans un repère inertiel I donne : m3 ~ 13 ~ 23 ~ R R d2 R = −Gm1 m3 3 − Gm2 m3 3 + T~ 2 dτ R13 R23 où : m1 , m2 et m3 sont les masses respectives de la Terre, la Lune et du satellite, ~ est le vecteur position du satellite, R (1) 2 ÉQUATIONS DU MOUVEMENT 3 ~ 13 est le vecteur Terre-satellite, R ~ 23 est le vecteur Lune-satellite, R G est la constante de gravitation universelle, et τ est l’unité de temps. On ramène le CR3BP à un système sans dimensions. La masse du troisième corps étant négligeable, la masse caractéristique est prise comme la somme des deux masses des primaires M 1 et M 2, m∗ = m1 + m2 . La longueur caractéristique est la distance entre les deux primaires, l∗ = R12 , ~ 12 est le vecteur Terre-Lune. Enfin le temps caractéristique τ ∗ est choisi de telle manière que la où R constanteq de gravitation sans dimension G∗ soit égale à 1. Par la troisième loi de Kepler, on conclut que τ ∗ = l∗ 3 Gm∗ . Les définitions précédentes nous mènent aux quantités sans dimensions suivantes : ~r = ~ R , l∗ ~rij = ~ ij R l∗ {i, j} ∈ {1, 2, 3}, µ= m2 m∗ et t = τ . τ∗ Étant donné que la poussée de l’engin est bornée, on normalise T~ comme suit : T~ = Tmax ~u, où Tmax est la poussée maximale de l’engin et ~u est le contrôle avec |~u| ≤ 1. Le contrôle ~u est la commande du moteur de l’engin, à déterminer selon les critères de minimisation. En divisant l’équation (1) par m3 et en utilisant le nouveau système d’unités on obtient : d2~r (1 − µ) µ l∗ 2 Tmax = − ) ~u ~ r − ~ r + ( 13 23 3 3 dt2 r13 r23 m∗ G m3 On pose ε = Tmax m3 (2) et on suppose que le terme qui figure entre parenthèses devant le contrôle est désormais sous entendu dans le terme ε, en fait, ceci ne nuit pas à l’écriture des équations et ce terme sera pris en compte dans les calculs numériques. On se propose d’écrire l’équation (2) dans un repère tournant à la vitesse angulaire de rotation des deux primaires autour de leur centre de masse, l’origine du repère. Les deux primaires étant fixes dans ce repère, elles se situent sur l’axe des abscisses : M 1 de coordonnées (−µ, 0, 0) et M 2 de coordonnées (1 − µ, 0, 0). On prend (x, y, z) comme coordonnées de M 3 dans le repère tournant R. 2 On exprime ( ddt2~r )I en fonction de x, y et z. ( d2~r d~r d2~r ) =( )R + 2~ ω × ( )R + ω ~ ×ω ~ × ~r I dt2 dt2 dt (3) où ω ~ est le vecteur de rotation angulaire de R par rapport à I, ω ~ = ~z dans le nouveau système d’unités. On a : ~r = x~x + y~y + z~z d~r )R = ẋ~x + ẏ~y + ż~z dt d2~r ( 2 )R = ẍ~x + ÿ~y + z̈~z dt ( 2 ÉQUATIONS DU MOUVEMENT 4 On revient à l’équation (3) on obtient : ( d2~r )I = (ẍ − 2ẏ − x)~x + (ÿ + 2ẋ − y)~y + z̈~z dt2 (4) De plus, on a : ~r13 = (x + µ)~x + y~y + z~z (5) ~r23 = (x − 1 + µ)~x + y~y + z~z (6) En combinant les équations (2), (4), (5) et (6), on obtient un système différentiel contrôlé du second ordre de dimension 3 : µ ẍ = 2ẏ + x − 1−µ 3 (x + µ) − r 3 (x − 1 + µ) + εu1 r13 23 µ ÿ = −2ẋ + y − 1−µ y − y + εu2 3 3 r13 r23 z̈ = − 1−µ z − µ z + εu 3 r13 3 r23 (7) 3 où (u1 , u2 , u3 ) sont les composantes du contrôle dans R. Ce système peut être écrit d’une manière plus compacte en introduisant la fonction potentiel Vµ (x, y, z) = − 1−µ r13 − µ r23 − 12 (x2 + y 2 ), notre système se réduit au suivant : ẍ − 2ẏ + Vµ x = εu1 ÿ + 2ẋ + Vµ y = εu2 z̈ + V = εu µz 3 où Vµ x = ∂Vµ ∂x , Vµ y = ∂Vµ ∂y et Vµ z = ∂Vµ ∂z . Remarque. L’écriture des équations du mouvement dans le système sans unités prédéfini précédemment est plus apte aux calculs numériques vu que cela nous offre une mise à l’échelle (scaling) intrinsèque. Le mouvement du troisème corps M 3 est restreint au plan orbital des deux primaires, on peut alors omettre l’équation en z. On pose q = q1 + iq2 = x + iy, le système précédent se ramène à l’équation suivante dans le plan complexe : q̈ + ∇Vµ (q) + 2iq̇ = εu où Vµ (q) = − 1−µ r1 − µ r2 2 − q2 avec r12 = (q1 + µ)2 + q22 et r22 = (q1 − 1 + µ)2 + q22 et u = u1 + iu2 . " # 2 2 q̇1 − q2 µ Si on pose p = q̇ + iq = et Jµ (q, p) = q̇2 + Vµ (q) = p2 + p1 q2 − p2 q1 − 1−µ r1 − r2 , on a q̇2 + q1 alors : ∂Jµ ∂Jµ q̇ = , ṗ = − + εu. ∂p ∂q On remarque que si u = 0 (système non contrôlé ou libre), on obtient un système hamiltonien. Le cas CR3BP contrôlé est donc une perturbation d’un système hamiltonien par un petit paramètre ε. 3 INTÉGRALE DE JACOBI ET RÉGION DE HILL 5 De plus, le système lui même est paramétré par un paramètre intrinsèque µ. En effet, le cas limite µ = 0 correspond à un problème à deux corps à savoir Terre - satellite, un problème plus simple et qu’on a déjà étudier auparavant. Pour le système Terre - Lune ; µ = 0.012153 << 1, on peut aussi donc dire que notre système est un problème à deux corps perturbé par un faible paramètre µ, d’où l’idée de la continuation 2 - 3 corps évoquée lors de la section 6 du rapport. 3 Intégrale de Jacobi et région de Hill On reprend le système non-contrôlé écrit à l’aide des deux variables p et q : q̇ = ∂Jµ , ∂p ṗ = − ∂Jµ . ∂q On est donc en face d’un système hamiltonien classique. Il est bein connu (et facile à vérifier) que Jµ (q, p) est constant le long des solutions de ce système. Donc le système (7) (on omet l’équation en z) posséde l’intégrale première : E(x, y, ẋ, ẏ) = Jµ (q, p) = Jµ (x + iy, (ẋ − y) + i(ẏ + x)) = ẋ2 + ẏ 2 + Vµ (x, y) 2 Autrement dit, toute solution est telle que : ẋ2 + ẏ 2 + Vµ (x, y) = e 2 où e est une constante. En mécanique céleste ou en astronomie, on fait généralement référence à l’intégrale de Jacobi définie ainsi : C = −2e. Aucune autre intégrale première n’est connue. E(x, y) n’est autre que l’énergie du troisième corps dans le champs d’attraction des deux primaires (énergie cinétique ẋ2 +ẏ 2 2 + énergie potentielle Vµ (x, y)), on parle aussi d’énergie intégrale. Pour une valeur fixée e de l’énergie, les solutions sont sur une surface dite d’énergie (variété de dimension 3 dans l’espaces des phases de dimension 4). On définit la région de Hill comme suit : {(x, y) ∈ R2 |Vµ (x, y) ≤ e}. Elle correspond à la région de mouvement possible pour energie donnée e. La figure 1 visualise les régions de Hill selon l’évolution de e (e croissante) pour le système Terre-Lune, la région où le mouvement est autorisé est grisée. Il existe cinq portraits possibles de la région de Hill selon la valeur de e. On note Ei l’énergie du point de libration Li (cf. section suivante). On a E2 < E1 < E3 < E4 = E5 . On a alors les configurations suivantes : 3 INTÉGRALE DE JACOBI ET RÉGION DE HILL −2 −2 −1.5 −1.5 L4 −1 6 L4 −1 −0.5 −0.5 L3 0 L2 L1 L3 0 0.5 L2 0.5 1 1 L5 L5 1.5 2 −2 1.5 −1.5 −1 −0.5 0 0.5 1 1.5 2 2 −2 −2 −2 −1.5 −1.5 L4 −1 −1.5 −1 −0.5 0 0.5 1 1.5 2 1.5 2 L4 −1 −0.5 −0.5 L3 0 L2 L1 L3 0 0.5 L2 L1 0.5 1 1 L5 L5 1.5 2 −2 L1 1.5 −1.5 −1 −0.5 0 0.5 1 1.5 2 2 −2 −1.5 −1 −0.5 0 0.5 1 Fig. 1 – Région de Hill en fonction de e pour µ = 0.012153. – si e < E2 , M3 ne peut se déplacer qu’autour M 1 et M 2 (figure 1 en haut à gauche). – si E2 < e < E1 , M 3 peut aussi en plus se déplacer dans la zone entre M 1 et M 2 (figure 1 en haut à droite). – si E1 < e < E3 , M 3 peut passer à la zone extérieure via un passage autour de L1 (figure 1 en bas à gauche). – si E3 < e < E4 = E5 , M 3 peut passer à la région extérieur via un passage par L3 (figure 1 en haut à droite). – si e > E4 = E5 , M 3 est libre de l’attraction de M 1 et M 2. L’introduction du paramètre ε dans ce système hamiltonien permet de jouer sur la vitesse de M 3 et permet donc contrôler son energie e. On obtient une énergie fonction du temps e(t) tout au long du transfert, ceci induit des changements dans la topologie de la région de Hill en fonction du temps : la dynamique de la région de Hill. Cette dynamique sera traitée ultérieurement dans le cas du transfert Terre - point L2 . 4 4 POINTS DE LIBRATION 7 Points de libration De nombreuses études sont faites sur le CR3BP non contrôlé. On traite dans ce paragraphe quelques propriétés de ce système. On remarque que le système différentiel décrivant le CR3BP libre est autonome (ne dépend pas du temps) ceci est dû à la formulation du problème dans le repère tournant. Donc, on peut estimer la présence d’emplacements d’équilibre invariants. De tels emplacements sont caractérisés par une position et une vitesse stationnaires. Ils sont déterminées en annulant en même temps l’accélération et la vitesse dans le système suivant : µ ẍ = 2ẏ + x − 1−µ 3 (x + µ) − r 3 (x − 1 + µ) r13 23 µ y − y ÿ = −2ẋ + y − 1−µ 3 3 r13 r23 z̈ = − 1−µ z − µ z 3 r13 3 r23 On obtient alors : µ 1−µ (xeq + µ) − 3 (xeq − 1 + µ) 3 r13 r23 1−µ µ −yeq = − 3 yeq − 3 yeq r13 r23 µ 1−µ 0 = − 3 zeq − 3 zeq r13 r23 −xeq = − (8) (9) (10) L’équation (10) donne zeq = 0, donc tout les points d’équilibre se trouvent dans le plan orbital contenant les deux primaires. On remarque que, pour r13 = r23 = 1, les deux équations (8) et (9) sont vérifiées. On obtient ainsi deux solutions dites équilatérales ou triangulaires xeq = yeq = √ ± 23 1 2 − µ et car il forment des triangles équilatéraux avec la Terre et la Lune. Il existe aussi trois autres points d’équilibre situés sur l’axe des abscisses, dits les points colinéaires. Les abscisses de ces points sont calculées numériquement à partir de l’équation (8) avec yeq = 0 (la résolution de cette équation reveint à trouver les racines réelles d’un polynôme d’ordre 5). Pour le système Terre-Lune, µ = 0.012153, on a le point L2 situé entre la Terre et la Lune d’abscisse x2 ' 0.8369, le point L1 situé à droite de la Lune d’abscisse x1 ' 1.1557 et le point L3 situé à gauche de la Terre d’abscisse x3 ' −1.0051. Ces cinq points sont aussi dits points de libration ou points de Lagrange. La figure 2 montre plus clairement le positionnement de ces points. Dans notre étude, on s’intéresse au point d’équilibre L2 , vu sa position entre les deux primaires. On essaye de calculer de manière plus précise son abscisse x2 [7], −µ ≤ x2 ≤ 1 − µ. On reprend l’équation (8) et on substitue yeq par 0 on obtient : x2 = 1−µ µ − 2 (x2 + µ) (1 − µ − x2 )2 On pose ξ = 1 − µ − x2 , distance entre la Lune et le point L2 , l’équation précédente devient : −ξ + 1 − µ = 1−µ µ − 2 (1 − ξ)2 ξ (∗) 4 POINTS DE LIBRATION 8 Fig. 2 – Points de libration. Si on met au même dédominateur, on obtient une équation polynomiale d’ordre 5 dépendant uniquement du paramètre µ : ξ 5 − (3 − µ)ξ 4 + (3 − 2µ)ξ 3 − µξ 2 + 2µξ − µ = 0 On résout cette équation numériquent à l’aide d’un algorithme de recherche de zéros basique de type Newton en prenant comme point d’initialisation une valeur très proche de la solution. On détermine ainsi la valeur numérique de ξ avec une bonne précision (∼ 10−10 ) et puis la valeur de x2 . Une autre approche permet d’avoir un développement en séries de ξ. En effet, une factorisation judicieuse de (∗) nous donne : µ ξ 3 (1 − ξ + ξ 2 /3) = 3(1 − µ) (1 − ξ)3 (1 + ξ + ξ 2 ) 1 µ Une solution en séries de puissance de la quantité ν = [ 3(1−µ) ] 3 est la suivante : 1 1 23 151 4 1 5 ξ = ν(1 − ν − ν 2 − ν 3 + ν − ν ) + o(ν 7 ). 3 9 81 243 9 Si µ << 1 (cas des systèmes Terre-Lune et soleil-Terre par exemple), on peut écrire : µ µ µ = (1 + µ + µ2 + µ3 + µ4 + · · · ) ' . 3(1 − µ) 3 3 D’où le développement en séries de ξ en fonction de µ : µ 1 1 µ 1 1 µ 2 ξ = ( ) 3 (1 − ( ) 3 − ( ) 3 + · · · ) 3 3 3 9 3 Remarque. Suite au développement en séries de ξ en fonction de ν, une initialiation judicieuse de 1 µ l’algorithme de recherche de zéro est tout simplement ν = [ 3(1−µ) ]3 . 5 5 MINIMISATION DU TEMPS DU TRANSFERT 9 Minimisation du temps du transfert Tout le long de ce paragraphe on se place dans le cas du CR3PB contrôlé. Vu que le mouvement du satellite est restreint dans le plan orbital Terre-Lune, on omet l’équation en z dans le système (7) et on le ramène à un système du premier ordre de dimensions quatre. Si on désigne par (x1 , x2 ) la position du satellite et par (x3 , x4 ) sa vitesse, (7) devient : ẋ1 = x3 ẋ2 = x4 µ ẋ3 = 2x4 + x1 − 1−µ 3 (x1 + µ) − r 3 (x1 − 1 + µ) + εu1 r13 23 ẋ4 = −2x3 + x2 − 1−µ x2 − rµ3 x2 + εu2 r3 13 (11) 23 où p (x1 + µ)2 + x22 p = (x1 − 1 + µ)2 + x22 r13 = r23 On obtient alors un système de la forme ẋ = F (x, u) avec x = (x1 , x2 , x3 , x4 ) et F (x, u) = F0 (x) + εF1 (x)u1 + εF2 (x)u2 où x3 0 0 0 0 x4 F0 (x) = 2x + x − 1−µ (x + µ) − µ (x − 1 + µ) , F1 (x) = 1 et F2 (x) = 0 . 3 3 1 1 4 1 r13 r23 µ 1 0 −2x3 + x2 − 1−µ x − x 3 3 2 2 r13 r23 On se propose de déterminer le contrôle u = (u1 , u2 ) de l’engin à chaque instant du transfert de la GEO jusqu’à l’orbite lunaire désirée en optimisant le temps de transfert tf . On obtient alors le problème de contrôle opitmal suivant : Rt min tf = 0 f dt ẋ = F0 (x) + εF1 (x)u1 + εF2 (x)u2 (Pµ,ε ) |u| ≤ 1 x(0) fixé (la GEO) c (x(t )) = 0 (une orbite lunaire) f f Comme indiqué dans l’introduction, on utilisera pour résoudre de tels problèmes les méthodes indirectes. On applique donc le principe de maximum de Pontryagin (PMP)[6, 8]. Pour cela, on introduit l’états adjoind (p0 , p) avec p = (p1 , p2 , p3 , p4 ) et p0 ≤ 0 et on écrit l’hamiltonien du système : H(x, p, u) = p0 + hp, F (x, u)i = p0 + hp, F0 (x)i + εhp, F1 (x)iu1 + εhp, F2 (x)iu2 . On se place dans le cas normal p0 6= 0, on pourra prendre alors dans toute la suite p0 = −1. On pose Hi = hp, Fi (x)i pour i ∈ 0, 1, 2, H devient : H(x, p, u) = −1 + H0 + εH1 u1 + εH2 u2 . 5 MINIMISATION DU TEMPS DU TRANSFERT 10 L’application du PMP donne : ∂H (x, p, u) ∂p ∂H ṗ = − (x, p, u) ∂x u = argmax|v|≤1 H(x, p, v) ẋ = = argmax|v|≤1 H1 v1 + H2 v2 Un simple calcul de lagrangien nous donne : u = H1 H12 +H22 √ H2 2 2 H1 +H2 √ si (H1 , H2 ) 6= (0, 0), sinon toute valeur de u telle que |u| ≤ 1 satisfait la condition de maximisation. L’équation H1 = H2 = 0 définit ce qu’on appelle surface de commutation de codimension 2. L’hamiltonien après maximisation s’écrit alors q H(x, p) = −1 + H0 + ε H12 + H22 Hors les surfaces de commutations l’hamiltonien est lisse. On appelle extrémale tout couple (x, p) ∂H vérifiant le système hamiltonien (i.e. (ẋ, ṗ) = ( ∂H ∂p (x, p), − ∂x (x, p))). Dans le cas lisse, ces extrémales sont dites d’ordre zéro (la courbe (x, p) ne touche pas la surface H12 +H22 = 0). On se propose d’étudier le comportement des extrémales à un instant t̄ où on a éventuellement H12 (t̄) + H22 (t̄) = 0. On pose ψ ~ ψ = (H1 , H2 ), le contrôle s’écrit u = |ψ| si ψ 6= 0. On pose z = (x, p), on a alors ż = H(z) avec ∂H ∂H ~ = ( (x, p), − (x, p)). On introduit les deux lemmes suivants [3] : H ∂p ∂x ~ Lemme1. Si F est un champs de vecteurs sur x (z = (x, p), ż = H(z)) et HF = hp, F i alors d dt (HF (z(t))) = {H, HF } où {., .} désigne le crochet de Poisson. Démonstration. d d (HF (z(t))) = pF (x) dt dt = pF 0 (x) |{z} ẋ + ṗ F (x) |{z} | {z } | {z } ∂HF ∂x = ∂H ∂p − ∂H ∂x ∂HF ∂p X ∂HF ∂H ∂H ∂HF − ) ( ∂xi ∂pi ∂xi ∂pi i = {H, HF } ~ Lemme2. Si F et G sont deux champs de vecteurs sur x (z = (x, p), ż = H(z)) et HF = hp, F i et HG = hp, Gi alors {HF , HG } = H[F,G] où [., .] désigne le crochet de Lie de champs de vecteurs. 5 MINIMISATION DU TEMPS DU TRANSFERT 11 Démonstration. {HF , HG } = X ∂HG ∂HF ∂HF ∂HG ( − ) ∂x ∂p ∂xi ∂pi i i i = pG0 (x)F (x) − pF 0 (x)G(x) = p(G0 (x)F (x) − F 0 (x)G(x)) = hp, [F, G]i = H[F,G] On revient à notre cas, z étant absolument continu, la fonction ψ admet alors des dérivées presque partout ψ̇ = (Ḣ1 , Ḣ2 ). On rappelle que H = −1 + H0 + u1 H1 + u2 H2 , H1 = hp, F1 i et H2 = hp, F2 i. D’après le lemme 1 on a : Ḣ1 = {H, H1 } = {H0 , H1 } + u2 {H2 , H1 } Ḣ2 = {H, H2 } = {H0 , H2 } + u1 {H1 , H2 } or d’après le lemme 2, {H1 , H2 } = H[F1 ,F2 ] = hp, [F1 , F2 ]i = 0 d’où ψ̇ = ({H0 , H1 }, {H0 , H2 }), vu | {z } 0 que {H0 , H1 } et {H0 , H2 } sont continues alors ψ est C 1 et ψ̇ existe partout. Si ψ̇ = 0 alors {H0 , H1 } = H[F0 ,F1 ] = hp, [F0 , F1 ]i = 0 et {H0 , H2 } = H[F0 ,F2 ] = hp, [F0 , F2 ]i = 0, par suite p ⊥ [F0 , F1 ] et p ⊥ [F0 , F2 ]. On a ψ(t̄) = (H1 (t̄), H2 (t̄)) = (0, 0) donc aussi p ⊥ F1 et p ⊥ F2 . De plus, dans notre cas, on a Vectx {F1 , F2 , [F0 , F1 ], [F0 , F2 ]} = R4 par conséquent p(t̄) = 0 et H(t̄) = −1 ce qui est absurde car l’hamiltonien est nul tout au long du transfert dans le cas de la minimisation du temps. Ainsi on vient de démontrer que s’il existe un instant t̄ tel que ψ(t̄) = 0 alors ψ̇(t̄) 6= 0. D’où la proposition suivante [3] : Proposition. Les contacts éventuels avec la surface de commutation sont d’ordre égal à 1, la courbe (x, p) traverse la surface H1 = H2 = 0 et au passage le contrôle u tourne d’un angle de π d’où le terme π-singularité. De plus, le nombre d’instant de commutation est fini. Démonstration. On a déjà démontré que si ψ(t̄) = 0 alors ψ̇(t̄) 6= 0 (d’où les contacts éventuels avec la surface de commutation sont d’ordre égal à 1), ψ est donc localement le graphe d’une fonction à valeurs dans R2 , passant par l’origine et possèdant une tangente en ce point (cf. figure 3). En conséquence, le quotient ψ |ψ| = u posséde des limites à gauche et à droite en t̄ qui sont opposées, donc le contrôle tourne d’un angle π au passage par la surface de commutation. Supposons qu’il existe une infinité d’instants de commutation (ti )i∈N avec ti ∈ [0 tf ] ∀i ∈ N, donc on peut en extraire une sous suite (tϕ(i) )i∈N convergente de limite t̄. Par continuité de ψ, on a ψ(t̄) = 0. ψ est C 1 alors lim i→∞ ψ(tϕ(i) )−ψ(t̄)=0 tϕ(i) −t̄ instants de commutation est fini. = 0 = ψ̇(t̄) ce qui est absurde ainsi le nombre de 6 CONTINUATION DEUX-TROIS CORPS 12 Fig. 3 – Commutation d’angle π. 6 Continuation deux-trois corps Après application du PMP, le problème (Pµ,ε ) se ramène à un problème de tir classique (vu qu’on ne connaît pas p(0)). On est donc amené ! à chercher les zéros de la fonction de tir S définie comme cf (x(tf )) . Il est bien connu que cf (x(tf )) = 0 est la condition réalisant suit : S : (tf , p(0)) 7→ H(tf ) la mise du satellite sur l’orbite désirée, l’équation H = 0 est vérifiée tout au long du transfert à cause de la minimisation du temps (temps final libre) et l’autonomie du système. En effet [6, 8], d’après le PMP, comme le temps final tf est libre alors on a max|v|≤1 H(x(tf ), p(tf ), v) = 0. Puis vu que H est autonome par rapport au temps, on a max|v|≤1 H(x(t), p(t), v) = 0 pour tout 0 ≤ t ≤ tf . On vient de démontrer que le contrôle u est continu ou continu sauf en un nombre fini de points (cas où on traverse la surface de commutations) donc on a presque partout H(x(t), p(t), u(t)) = max|v|≤1 H(x(t), p(t), v) = 0 et comme H est continu alors ∀t ∈ [0, tf ], H(x(t), p(t), u(t)) = 0. On utilise des algorithmes de recherche de zéros du type Newton qui sont très sensibles au point d’initialisation. Le choix de l’initialisation doit être ajusté de telle manière que l’algorithme ne diverge pas. Pour faciliter la recherche de l’initialisation, on utilise des méthodes homotopiques. L’idée des méthodes homotopiques est de plonger notre problème de départ (Pµ,ε ) dans une famille de problèmes (Pµ,ε )λ dépendant d’un paramètre λ ∈ [0, 1] telle que pour λ = 0 le problème soit facile à résoudre et pour λ = 1 nous retrouvons le problème de départ. Nous espérons ainsi lorsque ce paramètre homotopique parcourt le segment [0, 1], que le chemin des solutions des problèmes (Pλ ) 6 CONTINUATION DEUX-TROIS CORPS 13 nous amène à la solution recherchée. Ils existent des méthodes homotopiques discrètes, simpliciales, différentielles, etc... . On utilise dans notre étude dans un premier temps les méthodes dicrètes. Cette méthode est appelée aussi continuation discrète. C’est une approche basique qui consiste en la résolution d’une séquence de problèmes (Pλk ), k = 1 . . . N telle que λ0 = 0 et λN = 1, en utilisant la solution du problème (Pλk ) comme initialisation pour la résolution du problème (Pλk+1 ). Le pas de dicrétisation hk = λk+1 − λk est ajusté de la façon suivante : on introduit une tolérence sur la norme de l’homotopie de tir qui indique la réussite de la convergence (Si la norme de l’homotopie à la solution est inférieure ou égale à la tolérence on suppose que la solution obtenue est acceptable). On commence avec h0 = 1 et on essaie de résoudre (P1 ) directement. En cas d’échec de résolution, on diminue le pas de discrétisation et on recommence de nouveau jusqu’à atteindre λ = 1. Vu l’expérience que j’ai eue pendant mon stage de master [5] pour les problèmes de transfert orbital à deux corps et les anciens travaux portant sur la minimisation du temps de transfert [4, 2] au sein de l’équipe de travail, l’idée est de partir d’un problème à deux corps à savoir la Terre et le satellite qu’on sait bien résoudre et d’essayer d’arriver à notre problème des trois corps. Ceci revient tout simplement à supposer au départ que la masse de la Lune est nulle et de considérer une homotopie sur le paramètre µ : µ(λ) = λµT erre−Lune . Pour µ = 0, on retrouve un problème à deux corps, pour ce type de problème on utilise un système de coordonnées plus adéquat dit coordonnées de Gauss modifiées (P, ex , ey , hx , hy , L) où : • P = a(1 − e2 ) est le paramètre de l’ellipse osculatrice avec a le grand axe de l’ellipse et e son excentricité ; • ex = e cos (Ω + ω) avec Ω la longitude du nœud ascendant et ω l’argument du périgée ; • ey = e sin (Ω + ω) ; • hx = tan (i/2) cos (Ω) avec i l’inclinaison du plan orbital par rapport au plan équatorial ; • hy = tan (i/2) sin (Ω) ; • L = Ω + ω + ν est la longitude cumulée avec ν l’anomalie vraie. On choisit d’exprimer le contrôle dans le repère mobile (q, s, w) attaché au satellite qui est défini suivant le vecteur position de l’engin r et le vecteur vitesse v. L’expression du nouveau repère est alors : q= r , |r| s = w ∧ s, r∧v w= . |r ∧ v| Par hypothèse, on restreint le mouvement du satellite dans le plan orbital de la Terre et la Lune, on pourra supposer donc que i = 0 tout au long du transfert et les coordonnées utilisées se réduisent à x = (P, ex , ey , L), de plus le contrôle est plan donc il est exprimé dans une base de deux vecteurs 6 CONTINUATION DEUX-TROIS CORPS 14 Z satellite perigee v v w equatorial plan s k ω i Ω X q r j O S i Y orbit Fig. 4 – Éléments orbitaux et repère ortho-radial. (q, s). On prend comme point de départ un point de la GEO circulaire de coordonnées (42.165, 0, 0, π). Pour des raisons de facilité, on prend comme point d’arrivée un point de l’orbite de la Lune autour de la Terre, qu’on suppose aussi circulaire, de coordonnées (384.402, 0, 0, libre). Le problème (P0,ε ) s’écrit alors dans le nouveau système de coordonnées : R tf min 0 dt ẋ = f0 (x) + ε(u1 f1 (x) + u2 f2 (x)) |u| ≤ 1 (P0,ε ) P (0), ex (0), ey (0), L(0) fixés P (tf ), ex (tf ), ey (tf ) l’orbite lunaire L(tf ) libre avec : r f0 (x) = µ P 0 0 , 0 2 W /P s f1 (x) = s f2 (x) = P µ P µ 0 sin(L) − cos(L) 0 , 2P/W cos(L) + (ex + cos(L))/W sin(L) + (e + sin(L))/W y 0 , 7 CIBLE L2 - POINTS CONJUGUÉS 15 et W = 1 + ex cos(L) + ey sin(L), On remarque que (P0,ε ) a la même forme dans les deux systèmes de coordonnées, l’application du PMP donne alors un contrôle de même forme. Le fait que L(tf ) est libre nous donne par les conditions de transversalité pL (tf ) = 0 en plus du fait que H = 0 tout au long du transfert. Notre fonction de tir s’écrit alors : SG P (tf ) − 384.402 ex (tf ) : (tf , p(0)) 7→ ey (tf ) p (t ) L f H(tf ) Dans la suite des simulations numériques, on prend la masse du satellite m3 égale à 1500Kg. On se propose de chercher les extrémales de (P0,ε ) pour des faibles valeurs de poussées Tmax (on rappelle que ε = Tmax m3 ). En effet, les nouvelles missions spatiales s’effectuent avec des moteurs à propulsion ionique de faibles poussées par exemple pour la mission SMART1 la poussée est de 73.19mN . On trouve facilement une initialisation adéquate de S G pour Tmax = 60N . Pour aller à des poussées plus faibles, on introduit une homotopie portant sur la poussée maximale Tmax . On utilise les méthodes homotopiques dicrètes en partant de Tmax = 60N . On a pu atteindre Tmax = 85mN . La grille d’initialisations trouvée pour (P0,ε ) dans le repère fixe en coordonnées de Gauss modifiées nous permet de trouver une grille d’initialisation pour (P0,ε ) dans le repère tournant du CR3BP, en effet, il suffit de bien écrire les matrices de changement de repères entre le repère tourant cartésien et le repère définie par les coordonnées de Gauss modifiées et de tenir compte des changement des unités de mesure. Remarque. Toutes les simulations numériques effectuées dans cette étude (calcul d’extrémales et tests d’optimalité) sont faites avec le logiciel COTCOT [1]. 7 Cible L2 - Points conjugués On reprend maintenant le repère tournant du CR3BP et notre homotopie sur le paramètre µ. Au lieu de viser directement une orbite autour de la Lune, on vise au départ le point d’équilibre L2 ceci pour quatre raisons : - pour µ = 0, l’orbite de la Lune est confondue avec celle du point L2 ; - il est plus facile de viser un point qu’une orbite (ensemble de points) ; - le point L2 est important mathématiquement et physiquement ; - pour faciliter le calcul numérique par une étape intermédiare. On suppose qu’on arrive au point L2 avec une vitesse finale nulle (on vise un point de R4 dans 7 CIBLE L2 - POINTS CONJUGUÉS 16 l’espace des phases). La fonction de tir correspondante s’écrit alors x1 (tf ) − 0.8369 x2 (tf ) S : (tf , p(0)) 7→ x3 (tf ) x (t ) 4 f H(tf ) : Les premiers tests numériques effectués pour µ = µT erre−Lune ont montré que la conaissannce seule du tf min (µ = 0) permet de faire converger l’algorithme de tir (on prend des valeurs arbitraires pour le vecteur adjoint p(0)). Un seul pas d’homotopie est suffisant pour passer des deux corps aux trois corps. En fait, la connaissance d’une bonne approximation du temps final est le point clé pour l’initialisation de la fonction de tir. On a pu donc trouver des extrémales solutions de (PµT erre−Lune ,ε ) pour des poussées de 10 et 1N . Cette technique n’est plus valide pour des poussées plus faibles que 1N , pour aller plus loin en poussées faibles, on introduit alors une homotopie sur Tmax partant de 1N , on a pu atteindre une poussée de 0.17N avec des pas à la fin de l’homotopie de 10−5 N . On a alors une grille d’initialisation allant de Tmax = 10N jusqu’à Tmax = 0.17N . On présente des exemples de trajectoires optimales pour différentes poussées dans la figure 5. On remarque que chacune des trajectoires comporte deux parties : une partie dite keplerienne où le satellite n’est soumis pratiquement qu’à l’attraction Terrestre, on est en présence pratiquement d’un système à deux corps, puis une deuxiéme partie où le satellite commence à quitter la zone d’attraction Terrestre pour atteindre le point L2 . Le principe du maximum de Pontryagin constitue une condition nécessaire et non suffisante. Pour vérifier l’optimalité locale de la solution trouvée on teste la conditon du second ordre. Étant donnée une solution du PMP, on se procure un tube autour de cette solution et on essaye de voir s’il y a d’autres solutions optimales contenues dans ce tube. On fait ce qu’on appelle le test des points des conjugués [2]. Définition. (i) Un point conjugué est une valeur critique de l’application exponentielle, expxi : R × R4 → R4 (t, pi ) 7→ x(t, xi , pi ). où xi et pi sont les valeurs initiales de x et p. (ii) Le temps du point critique associé s’appelle temps conjugué. (iii) On appelle premier temps conjugué d’une extrémale t 7→ x(t, xi , pi ) définie par pi le premier instant où on atteint un point critique de expxi . Dans notre cas, vue la condition de minimisation du temps final, on a toujours H = 0 donc l’état adjoint p est sur une variété de dimension 4 − 1 = 3. On introduit alors la fonction exponentielle 7 CIBLE L2 - POINTS CONJUGUÉS 17 0.5 0.4 0.2 0 0 !0.2 !0.5 !0.4 0 0.2 0.4 0.6 0.8 0.5 !0.4 !0.2 0 0.2 0.4 0.6 0.8 0.4 0.2 0 0 !0.2 !0.4 !0.5 !0.4 !0.2 0 0.2 0.4 0.6 0.8 !0.6 !0.5 0 0.5 Fig. 5 – Trajectoires en temps minimum vers L2 pour 10, 1, 0.5 et 0.17 Newtons (pour les trajectoires dans le repère fixe de centre la Terre cf. figure 11). 7 CIBLE L2 - POINTS CONJUGUÉS 18 suivante : expx0 : R × R3 → R4 (t, p0 ) 7→ x(t, x0 , p0 ). où x0 et p0 sont les valeurs initiales de x et p. L’instant t1c est alors le premier temps conjugué si : det(Jacexpx0 (t1c , p0 )) = 0 et ∀t < t1c , det(Jacexpx0 (t, p0 )) 6= 0 où Jacexpx0 est la matrice jacobienne de l’application expx0 . On se propose de calculer la matrice jacobienne de expx0 nécessaire au calcul du premier temps conjugué. ∂x ∂x (t, x0 , p0 ) (t, x0 , p0 )] ∂t ∂p0 ∂x = [ẋ(t) (t, x0 , p0 )] ∂p0 Jacexpx0 (t, p0 ) = [ On considère l’application partielle expx0 (t, .) : p0 7→ x(t, x0 , p0 ), on a expx0 (t, .) = Π ◦ ϕ ◦ j où ( ~ ż = H(z) ϕ : (t, z0 ) 7→ z(t, z0 ) avec z(t, z0 ) solution du système , Π : z = (x, p) 7→ x z(0) = (x0 , p0 ) = z0 et j : p0 7→ z0 = (x0 , p0 ). On a alors : ∂ expx0 ∂x (t, x0 , p0 ) = (t, p0 ) ∂p0 ∂p0 dΠ ∂ϕ dj = dz ∂z0 dp0 " # 0 ∂ϕ = [I4 0] ∂z0 I4 ( ∂ϕ ∂z0 est solution du système variationnel ~ δ ż = dH(z(t, z0 )).δz , l’équation différentielle figurant δz(0) = I8 dans ce système est dite équation de Jacobi. Un champs de Jacobi est une solution non triviale J = (δx, δp) de l’équation de Jacobi. Proposition. [2]On suppose que : – La forme quadratique ∂2H ∂u2 est définie positive tout au long de l’extrémale ; – La fonction Ex0 ,t : u 7→ x(t, x0 , p0 ) n’est pas surjective pour tout 0 < t ≤ tf ; – On n’est pas dans le cas exceptionnel i.e. H0 + H1 u1 + H2 u2 6= 0 le long de l’extrémale. Sous ces hypothèses, une extrémale est C 0 -localement optimale jusqu’au premier point conjugué. Le test d’optimalité est alors très simple, il suffit de vérifier que tf < t1c . On pose " # " # " # ∂x δx 0 ∂ϕ ∂p0 (t, x0 , p0 ) δz = = = ∂p ∂z0 I4 δp (t, x0 , p0 ) ∂p0 7 CIBLE L2 - POINTS CONJUGUÉS 19 δz est de dimension 8 × 4. Étant donnée que H = 0 le long de l’extrémale, p est contenu dans une variété de R4 de dimension 3. On peut donc réduire δz à trois colonnes au lieu de quatre. Le test numérique consiste alors à calculer δz par intégration numérique du système variationel et évaluer, à chaque instant t, det(δx1 (t), δx2 (t), δx3 (t), ẋ(t)). Un temps conjugué tc est détecté lorsque det(δx1 (tc ), δx2 (tc ), δx3 (tc ), ẋ(tc )) = 0 Les tests de points conjugués sont résumés dans la table suivante : Tmax tf min t1c t1c /tf min 10 1.470566633802046 2.275078393243948 1.547076032428326 1 8.440118858213319 10.640001984456987 1.260645988901317 0.91 9.771072365657723 12.045026891057153 1.232723128056207 0.83 11.152247725959276 13.500018429122381 1.210519956232514 0.74 13.157672247027882 15.595000128504694 1.185240051258106 0.65 14.369930436233620 16.900006380267907 1.176067375918169 0.53 18.024798634539373 20.700025000258922 1.148419209554621 0.44 21.323275412549972 24.125635629178436 1.131422596313656 0.3 32.216276854781320 35.295058947217477 1.095566042789927 0.1789 51.504129714977552 54.930014374272687 1.066516698335723 D’après cette table, on a toujours tf < t1c ce qui montre que les solutions trouvées sont optimales localement. On se propose d’étudier la dynamique des régions de Hill à chaque instant t du transfert, on a ε 6= 0 donc l’énergie intégrale e du système est une fonction du temps. On rappelle la définition de la région de Hill à l’instant t : {(x, y) ∈ R2 |Vµ (x, y) ≤ e(t)}. Ceci revient à déterminer les régions de l’espace accessibles à l’instant t à partir du point (x(t), y(t)) si on libère le satellite (on met le contrôle à zéro). On visualise sur la figure 6 l’évolution des régions de Hill (début : instant t1 , milieu : instant t2 et fin du transfert : instant t3 ). Aux trois instants t1 < t2 < t3 , on associe les trois points P 1 = P (t1 ) = (x(t1 ), y(t1 )), P 2 = P (t2 ) = (x(t2 ), y(t2 )) et P 3 = P (t3 ) = (x(t3 ), y(t3 )). Pour chaque instant t ∈ {t1 , t2 , t3 }, on trace aussi sur la même figure une trajectoire contrôlée jusqu’au instant t (en rouge) et une trajectoires libre ou osculatrice (contrôle nul) à partir de l’instant t (en bleu), le point où on met le contrôle à zéro est marqué par un astérix sur les figures, il s’agit du point P (t) = (x(t), y(t)) où on calcule l’energie e(t) pour déterminer la région de Hill à l’instant t. On observe aussi l’évolution de l’énergie intégrale (ou de Jµ intégrale première du système libre non contrôlé) le long du transfert (cf. figure 7). La figure à droite en bas de la figure 6 présente plus clairement ce qui se passe à la fin du transfert (quand le satellite arrive au le point L2 ), en effet, c’est un zoom de la figure juste à coté à gauche. On remarque que celui-ci ne reste pas longtemps au point L2 mais il est capturé par la Lune. En effet, le point visé réellement est un point de l’espace des phases (position et vitesse) de dimension 4, 2 0.4 1 7 CIBLE L2 - POINTS CONJUGUÉS 20 0.2 0 0 !1 !0.2 !2 !0.4 !2 !1 0 1 2 !0 2 0.4 0.4 0.2 0.4 0.2 0.4 0 0 0.2 0 0.2 !1 !0.2 0 0 !0.2 1 0.6 0.4 0.2 1 !2 2 !0.4 !0.2 !0.4 !2 !0.6 !1 !0.2 0 0 1 P1 0.22 0.4 !0.6 !0.4 0 P2 !0.2 !0.4 !0.4 !0.2 0 0.2 !0.2 0.4 !0.4 1 2 !0.6 0.4 1 0.2 0.6 0.5 0 0.4 0 !0.2 0.2 !0.5 !0.4 1 !0.4 !0.2 0 0.2 !1 !0.2 0 0 0.4 0.5 1 0.6 0.4 0.2 P3 0 P3 !0.2 0 !0.4 1 !0.4 !0.4 !1 !0.5 0.5 1 1 1.5 0.5 0 0 0.5 Fig. 6 – Trajectoires contrôlées puis osculatrices, régions de Hill (10 Newtons). 0 0.5 1 1 7 CIBLE L2 - POINTS CONJUGUÉS 21 −0.5 −1 −1.5 −2 −2.5 −3 −3.5 −4 −4.5 −5 −5.5 0 0.5 1 t Fig. 7 – évolution de Jµ le long du transfert (10 Newtons). 1.5 7 CIBLE L2 - POINTS CONJUGUÉS 22 les précisions sur les fonctions de tir aux points finaux est de l’ordre de 10−10 , on n’arrive donc pas numériquement exactement au point L2 et avec une vitesse nulle. La position d’arrivée non exacte ainsi que le petit incrément de vitesse amène le satellite à quitter rapidement L2 vers la Terre ou la Lune selon les signes des petites variations (erreurs) de la position et de la vitesse (δx, δy, δ ẋ, δ ẏ) autour du point L2 . En effet, ces variations sont régies par l’équation linéarisée du mouvement au voisinage de L2 : δ ẋ 0 0 δ ẏ 0 0 δ ẍ = − ∂ 2 V (x , 0) 0 ∂x2 2 ∂2V 0 − ∂y2 (x2 , 0) δ ÿ | {z A 0 0 1 . 0 2 2 0 } 1 δx δy δ ẋ δ ẏ La matrice A possède deux valeurs propres imaginaires pures et deux valeurs propres réelles une positive et une négative. La présence d’une valeur propre positive induit le caractère instable local de L2 d’où l’explication de la capture du satellite par la Terre ou la Lune lors de son arrivage au point L2 . Vu que le problème (Pµ,ε ) dépend de deux paramètres µ et ε (Tmax ), on essaye d’étudier le comportement des extrémales quand le paramètre µ varie. On prend Tmax = 1N . On introduit une homotopie sur µ partant de µT erre−Lune jusqu’à 0.5 (cas de deux planétes de mêmes masses). On présente des exemples de trajectoires optimales pour différentes valeurs de µ dans la figure 8. On remarque que la partie keplerienne des trajectoires est de plus en plus courte au fur et à mesure que µ augmente. On fait le test des points conjugués pour les différentes extrémales obtenues pour différentes valeurs de µ, la table suivante résume les résultats des tests effectués pour une poussée de 1N : µ tf min t1c t1c /tf min 0.012153 8.440099825863490 10.635048155422323 1.260061892020842 0.1 7.856528339755506 9.849000000000000 1.253607137157797 0.2 7.276968009437341 9.216352750603498 1.266509999583757 0.3 6.881785501415163 9.072009144753101 1.318263863773078 0.4 6.718500411887269 8.784035369066334 1.307439879519014 0.42 6.713953041575635 8.760003934459252 1.304746083300494 0.45 6.728716837504543 8.736045008301531 1.298322580556301 0.47 6.754134857622678 8.744025382294039 1.294618121583045 0.5 6.823072313018849 8.784011520305938 1.287398274168294 D’après cette table, on a toujours tf < t1c ce qui montre que les solutions trouvées sont optimales localement. CIBLE L2 - POINTS CONJUGUÉS 7 23 0.5 0.5 0.4 0.3 0.4 0.2 0.3 0.1 0.2 0 0.1 !0.1 0 !0.2 !0.1 !0.3 !0.2 !0.4 !0.3 !0.5 !0.4 !0.4 !0.2 0 0.2 0.4 0.6 0.8 !0.2 0 0.2 0.4 0.6 0.8 0.5 0.5 0.4 0.4 0.3 0.3 0.2 0.2 0.1 0.1 0 0 !0.1 !0.1 !0.2 !0.2 !0.3 !0.3 !0.4 !0.4 !0.4 !0.2 0 0.2 0.4 0.6 0.8 !0.6 !0.4 !0.2 0 0.2 0.4 Fig. 8 – Altération de la phase quasi-keplerienne µ égal à 0.1, 0.2, 0.3 et 0.5, Tmax = 1N (pour les trajectoires dans le repère fixe de centre la Terre cf. figure 12). 8 8 CIBLE LUNAIRE - POINTS FOCAUX 24 Cible lunaire - Points focaux Après l’étude des trajectoires temps minimal vers le point L2 , on s’intéresse à viser maintenant une orbite autour de la Lune. L’orbite visée est une orbite circulaire de rayon r = 13.084M m = 0.034 en unité normalisée (c’est la valeur du demi grand axe de l’orbite visée dans la mission SMART1). On écrit les équations caractéristiques de l’orbite finale circulaire : x21 (tf ) + x22 (tf ) = r2 x23 (tf ) + x24 (tf ) = v 2 x1 (tf )x3 (tf ) + x2 (tf )x4 (tf ) = 0 p où v est la vitesse du satellite sur l’orbite v = µr . On suppose que le satellite est suffisamment proche de la Lune, donc son mouvement n’est pas influencé par la Terre. La condition de transversalité du PMP nous permet d’avoir une quatrième équation reliant x(tf ) et p(tf ) à savoir : x1 (tf )p2 (tf ) − x2 (tf )p1 (tf ) + x3 (tf )p4 (tf ) − x4 (tf )p3 (tf ) = 0. La fonction de tir dans ce cas s’écrit alors : x21 (tf ) + x22 (tf ) − r2 2 x (tf ) + x2 (tf ) − v 2 4 3 S : (tf , p(0)) 7→ x1 (tf )x3 (tf ) + x2 (tf )x4 (tf ) x (t )p (t ) − x (t )p (t ) + x (t )p (t ) − x (t )p (t ) 2 f 1 f 3 f 4 f 4 f 3 f 1 f 2 f H(tf ) On reprend les vecteurs d’initialisation [tf p(0)] du cas précédent (où on vise le point L2 ). On garde le même vecteur p(0) et on joue légérement sur le paramètre tf ; on fait varier tf aux alentours de la valeur trouvée dans le cas précédent. Ceci nous permet de trouver des extrémales pour le cas orbite lunaire pour des poussées Tmax = 10 et 1N . Pour vérifier la bonne mise en orbite du satellite, on regarde la trajectoire libre du satellite après la fin du transfert. On observe qu’il décrit un tube circulaire autour de la Lune (et non une orbite bien fine). L’explication la plus évidente est le fait qu’on a omis l’influence de la Terre sur le satellite dans les équations de l’orbite. Pour cela on introduit une homotopie sur le rayon r de l’orbite partant de 0.034 à des valeurs plus basses. On a des extrémales pour rayons de 0.02, 0.015 et 0.01. Les trajectoires optimales ainsi que les trajectoires libres après la fin du transfert sont visualisées sur la figure 9 pour différentes valeurs de r et pour Tmax = 10N . On remarque que le le tube circulaire décrit par le satellite après la fin du transfert se rétressit au fur et à mesure que r diminue. Ceci justifie notre hypothèse de départ, vu qu’en se rapprochant de la Lune l’influence de la Terre diminue. La technique utilisée pour trouver les initialisations adéquates pour des poussées de 10 et 1N ne nous permet pas d’aller plus loin pour des plus faibles poussées. On introduit alors une homotopie sur Tmax partant de 1N et on essaye d’atteindre des poussées plus faibles. Cette homotpie est très 8 CIBLE LUNAIRE - POINTS FOCAUX 25 0.4 0.4 0.3 0.3 0.2 0.2 0.1 0.1 0 0 −0.1 −0.1 −0.2 −0.2 −0.3 −0.3 −0.4 −0.4 0 0.2 0.4 0.6 0.8 1 0.4 0.4 0.3 0.3 0.2 0.2 0.1 0.1 0 0 −0.1 −0.1 −0.2 −0.2 −0.3 −0.3 0 0.2 0.4 0.6 0.8 1 0 0.2 0.4 0.6 0.8 1 −0.4 −0.4 0 0.2 0.4 0.6 0.8 1 Fig. 9 – Différentes cibles lunaires circulaires de rayons r égal à 0.034, 0.02, 0.015 et 0.01, Tmax = 10N (pour les trajectoires dans le repère fixe de centre la Terre cf. figure 13). 8 CIBLE LUNAIRE - POINTS FOCAUX 26 délicate, en fait, on a dû utiliser des pas de 10−7 N . Jusqu’à l’instant de l’écriture de ces lignes, on a pu atteindre une poussée de 0.8N . On remarque (voir figure 10) qu’on obtient des extrémales de différentes formes. En effet, l’extrémale effectue un tour de plus atour de la Terre en passant de la poussée de 1N à 0.9N , entre ces deux poussées, on a des étapes intermédiaires où le satellite n’arrive pas à faire le tour complet autour de la Terre. Ces extrémales intermédiaire présente des tf min pratiquement le double de celles correspondant aux poussées de 1 et 0.9N . Le même phénomène se reproduit entre 0.9 et 0.84N . Ceci pourrait justifier la taille très petite du pas de l’homotopie. La difficulté lors de cette homotopie discrète nous amène à penser à utliser les méthodes homotopiques différentielles dans un premier temps pour comparer les deux méthodes puis dans un deuxième temps pour essayer de mieux comprendre le comportement du chemin de zéros. Comme dans le cas où l’on vise le point L2 , on teste aussi l’optimalité locale des trajectoires obtenues. Maintenant on vise un ensemble points (toute une orbite) et non un seul point (point L2 ), la notion des points conjugués n’est plus alors adaptée et on parle dans ce cas des points focaux [2], une notion plus générale. Notre cible finale est une orbite circulaire autour de la Lune, une sous variété M1 de R8 . En vertu du principe du maximum, une extrémale z = (x, p) doit vérifier la condition de transversalité z(tf ) ∈ M1⊥ . On dit qu’un temps tf oc est focal s’il existe un champs de Jacobi J = (δx, δp) tel que δx(0) = 0 et J(tf oc ) est tangent à M1⊥ en z(tf oc ) i.e. J(tf oc ) ∈ Tz(tf oc ) M1⊥ . Le test numérique est similaire à celui des points conjugués, par contre, on procéde par intégration rétrograde (on part de tf ) de l’équation de Jacobi avec J(tf ) ∈ Tz(tf ) M1⊥ comme condition initiale de l’intégration, le temps tf oc est focal si rg(δx1 (tf oc ), δx2 (tf oc ), δx3 (tf oc )) < 3. La condition d’optimalité locale devient t1f oc < 0 (premier temps focal négatif). Les tests effectués sont récapitulés dans la table suivante : 8 CIBLE LUNAIRE - POINTS FOCAUX 27 0.5 0.4 0.4 0.3 0.2 0.2 0.1 0 0 −0.1 −0.2 −0.2 −0.3 −0.4 −0.4 −0.5 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 1.6 0.8 1.4 0.6 1.2 1 0.4 0.8 0.6 0.2 0.4 0.2 0 0 −0.2 −0.2 −0.4 −0.4 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 1.2 −1.5 −1 −0.5 0 0.5 1 0.4 1.5 1 0.2 0.5 0 0 −0.2 −0.5 −0.4 −1 −1.5 −2.5 −0.6 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 Fig. 10 – Trajectoires solutions pour cible lunaire circulaire de rayon r égal à 0.034 et pour différentes poussées Tmax égal à 1, 0.97, 0.96, 0.93, 0.91 et 0.9N (pour les trajectoires dans le repère fixe de centre la Terre cf. figure 14). 9 CONCLUSION 28 Tmax tf min t1f oc 10 1.515693554966947 pas de points focaux 1 9.146635494011267 -19.228067141275645 0.97 9.474160273341 -27.5 0.96 13.100227991760 -21.214509209855947 0.95 14.383235352751 -21.9 0.94 15.520169634928 -27.23 0.93 16.624801498058 -22.16 0.92 17.803899709383 -27 0.91 18.914781658733 -27.3 0.9 10.7987060535816 -38.07 0.89 13.639710938615 -21.565 0.88 15.416426217668 -27.08 0.87 16.724698757257 -27.05 0.86 18.061441083624 -32 0.85 19.465091553847 -27.077888860556541 0.83 14.22770774065 -26.615 0.82 16.372790232075 -27.17 0.81 17.873436170790 -27.160473605132140 0.8 19.491254557340 -27.164961476564521 On remarque alors qu’on a toujours t1f oc < 0 donc les trajectoires trouvées sont bien optimales localement. La localité du test est bien vérifiée, en effet, il y a des trajectoires qui correspondent à des minimums locaux et non globaux (par exemple celles pour des poussées entre 0.97 et 0.91N ) mais leurs tests d’optimalité locale sont valides. 9 Conclusion On a construit une démarche numérique partant du probème à deux corps en coordonnées de Gauss modifiées (problème de transfert orbital classique qu’on sait résoudre) arrivant au problème à trois corps en coordonnées cartésiennes dans le repère tournant du CR3BP. Par cette démarche, on a réussi à calculer numériquement des extrémales temps minimal pour différentes cibles (point d’équilibre L2 et des orbites autour de la Lune) avec des précisions inférieure à 10−9 . On a aussi étudié le comportement des extrémales lorsque les paramètres du problème à savoir ε et µ varient. On a vérifié l’optimalité locale des trajectoires solutions obtenues par des tests de points conjugués (cible ponctuelle) et points focaux (cible une orbite lunaire). On continuera l’étude pour compléter les résultats sur le temps minimal : étude des lieux conjugués, étude plus fine du chemin des zéros dans le cas cible une orbite autour de la Lune, atteinte de poussées plus faibles et tests avec les 10 ANNEXES 29 homotopies différentielles et ensuite on passera à la minimisation de la consommation du carburant. 10 Annexes A Repère fixe On présente ici toutes les courbes des trajectoires solutions dans un repère fixe de centre la Terre. Dans ce repère, on suppose que la Lune et le point L2 décrivent des orbites circulaires tournant toutes les deux à la même vitesse de rotation, à savoir celle de Lune par rapport à la Terre. Ces deux orbites sont visualisées sur les figures suivantes par des cercles noirs (le cercle de plus grand rayon correspond à celui de la Lune), la croix rouge désigne la Terre, les courbes en bleu sont les trajectoires contrôlées et celles en vert sont les trajectoires libres après la fin du transfert marquée par ∗. A REPÈRE FIXE 30 300 300 200 200 100 100 0 0 −100 −100 −200 −200 −300 −300 −400 −300 −200 −100 0 100 200 300 400 300 300 200 200 100 100 0 0 −100 −100 −200 −200 −300 −300 −400 −300 −200 −100 0 100 200 300 400 −400 −300 −200 −100 0 100 200 300 400 −400 −300 −200 −100 0 100 200 300 400 Fig. 11 – Trajectoire en temps minimum vers L2 pour 10, 1, 0.5 et 0.17 Newtons dans le repère fixe de centre la terre (pour les trajectoires dans le repère tournant voir figure 5). A REPÈRE FIXE 31 300 300 200 200 100 100 0 0 −100 −100 −200 −200 −300 −300 −400 −300 −200 −100 0 100 200 300 400 300 300 200 200 100 100 0 0 −100 −100 −200 −200 −300 −300 −400 −300 −200 −100 0 100 200 300 400 −400 −300 −200 −100 0 100 200 300 400 −400 −300 −200 −100 0 100 200 300 400 Fig. 12 – Altération de la phase quasi-keplerienne µ égal à 0.1, 0.2, 0.3 et 0.5, Tmax = 1N dans le repère fixe de centre la terre (pour les trajectoires dans le repère tournant voir figure 8). A REPÈRE FIXE 32 300 300 200 200 100 100 0 0 −100 −100 −200 −200 −300 −300 −500 −400 −300 −200 −100 0 100 200 300 400 500 300 300 200 200 100 100 0 0 −100 −100 −200 −200 −300 −300 −400 −300 −200 −100 0 100 200 300 400 −400 −300 −200 −100 0 100 200 300 400 −400 −300 −200 −100 0 100 200 300 400 Fig. 13 – Différentes cibles lunaires circulaires de rayons r égal à 0.034, 0.02, 0.015 et 0.01, Tmax = 10N dans le repère fixe de centre la terre (pour les trajectoires dans le repère tournant voir figure 9). A REPÈRE FIXE 33 300 300 200 200 100 100 0 0 −100 −100 −200 −200 −300 −300 −400 −300 −200 −100 0 100 200 300 −400 400 −400 −300 −200 −100 0 100 200 300 400 600 300 500 400 200 300 100 200 0 100 −100 0 −200 −100 −300 −200 −400 −300 −500 −400 −300 −200 −100 0 100 200 300 400 500 −600 −400 −200 0 200 400 600 400 300 300 200 200 100 100 0 0 −100 −100 −200 −200 −300 −300 −400 −700 −600 −500 −400 −300 −200 −100 0 100 200 300 −500 −400 −300 −200 −100 0 100 200 300 400 Fig. 14 – Trajectoires solutions pour cible lunaire circulaire de rayon r égal à 0.034 et pour différentes poussées Tmax égal à 1, 0.97, 0.96, 0.93, 0.91 et 0.9N dans le repère fixe de centre la terre (pour les trajectoires dans le repère tournant voir figure 10). RÉFÉRENCES 34 Références [1] J.-B. Caillau B. Bonnard and E. Trélat. Cotcot - Short reference manual. Technical Rapport RT/APO/05/1, ENSEEIHT-IRIT, UMR CNRS 5505, 2 rue Camichel, F-31071 Toulouse, March 2005. http ://apo.enseeiht.fr/cotcot.zip. [2] J.-B. Caillau B. Bonnard and E. Trélat. GEOMETRIC OPTIMAL CONTROL OF ELLIPTIC KEPLERIAN ORBITS. Discrete and continuous Dynamical Systems-Series B, 5(4) :929–956, November 2005. [3] J.-B. Caillau and J. Noailles. COPLANAR CONTROL OF A SATELLITE AROUND THE EARTH. ESAIM : Control, Optimization and Calculus of Variations, 6 :239–258, February 2001. [4] Jean-Baptiste Caillau. Contribution à l’étude du contrôle en temps minimal des transferts orbitaux. Thèse de doctorat, Institut National Polytechnique de Toulouse, Toulouse, France, Novembre 2000. [5] Bilel Daoud. Transfert orbital à faible poussée avec consommation minimale. Rapport de master, Institut National Polytechnique de Toulouse, Toulouse, France, Septembre 2008. [6] R.Gamkrélidzé L. Pontryaguine, V. Boltianski and E. Michtchenko. Théorie mathématiques des processus optimaux. Éditions Mir, 1974. [7] V. Szebehely. THEORY OF ORBITS The Restricted Problem of Three Bodies. ACADEMIC PRESS, 1967. [8] E. Trélat. Contrôle optimal : théorie et applications. Vuibert, 2008.