Université de Bourgogne Institut de Mathématiques de Bourgogne

publicité
Université de Bourgogne
Institut de Mathématiques de Bourgogne
Université de Toulouse
École Nationale Supérieure d’Électrotechnique
Électronique, Informatique, Hydraulique et Télécom
Institut de Recherche en Informatique de Toulouse
Problème des trois corps restreint,
contrôle en temps minimum
J.-B. Caillau B. Daoud et J. Gergaud
Parallel Algorithms and Optimization Team
ENSEEIHT–IRIT (UMR CNRS 5505)
2 rue Camichel, F-31071 Toulouse
apo.enseeiht.fr
Technical Report RT/APO/09/03
Problème des trois corps restreint,
contrôle en temps minimum∗
J.-B. Caillau†, B. Daoud‡ et J. Gergaud§
Octobre 2009
1
introduction
On se propose d’étudier le mouvement d’un engin spatial soumis à l’attraction de deux planètes.
On traitera le cas particulier d’un satellite soumis à l’attraction de la Terre et de Lune. L’exemple le
plus connu est celui de la mission SMART1 de l’ESA. On se propose de réaliser des transferts TerreLune, l’orbite initiale étant une orbite autour de la Terre et la finale autour de la Lune. Le but de notre
étude est de déterminer la commande du moteur de l’engin spatial à chaque instant du transfert.
L’introduction de critères de minimisation, à savoir le temps minimal et la masse maximale, nous
ramène à un problème classique de contrôle optimal. On utilise, pour la résolution de tels problèmes,
des méthodes dites indirectes basées sur le principe de maximum de Pontryagin[6, 8]. D’autre part,
les méthodes directes sont basées sur une dicrétisation partielle (contrôle) ou totale (contrôle et
état) du problème et utilisent différentes approches pour résoudre le problème d’optimisation. Ces
méthodes connues pour leur robustesse présentent une basse précision et un problème d’optimisation
avec un grand nombre d’équations dépendant du pas de dicrétisation. Par conséquent, les méthodes
directes sont mal-adaptées pour des cas particuliers tels que les problèmes à contrôle bang-bang. On
montrera ultérieurement que le contrôle pour le transfert Terre-Lune avec maximisation de la masse
est bang-bang. On s’intéresse dans notre étude aux méthodes indirectes.
Le système {Terre, Lune, Satellite} est un problème à 3 corps. C’est un cas particulier du problème
des N corps, un probléme célébre de mécanique. Il s’agit d’étudier le mouvement de N points
massiques soumis à l’influence de leur attractions gravitationnelles mutuelles. Ce problème est d’un
grand intérêt d’un point de vue pratique (étude du système solaire, du système Terre-Lune (notre
cas), etc...).
∗ Rapport
de première année de thèse financée par une allocation ministérielle fléchée
de
Mathématiques,
Université
de
Bourgogne,
BP
47870,
F-21078
Dijon
([email protected]).
‡ Institut de Mathématiques, Université de Bourgogne, BP 47870, F-21078 Dijon ([email protected]).
§ ENSEEIHT-IRIT (UMR CNRS 5505), 2 rue Camichel, F-31071 Toulouse ([email protected]).
† Institut
1
2
ÉQUATIONS DU MOUVEMENT
2
Pour N = 2, on parle du problème de Kepler. Grâce à un nombre suffisant d’intégrales premières,
ce problème se résout analytiquement : toutes les solutions sont des ellipses, paraboles ou des hyperboles dans un repère rattaché à l’un des deux corps. Le cas N = 3 (notre cas) est d’une plus grande
difficulté.
Pour faciliter notre tâche, on commence par étudier un problème plus simple le CR3BP (Circular
Restricted Three Bodies Problem) défini comme suit par Victor Szebehely [7] "Deux corps décrivent
des orbites circulaires autour de leur centre de masse sous l’influence de leur attraction gravitationnelle mutuelle, et un troisième corps (attiré par les deux précédents mais sans influence sur leur
mouvement) se déplace dans le plan défini par les deux corps en rotation. Le problème restreint
consiste à décrire le mouvement de ce troisième corps.".
Cette définition est remplie en rajoutant au problème des 3 corps des hypothèses simplificatrices
correspondantes à notre cas particulier :
– On suppose que le troisième corps M 3 n’influence pas les corps M 1 et M 2, dont le mouvement
est donné comme une solution du problème de Kepler. Ceci revient à prendre nulle la masse de
M 3 dans les équations de mouvements de M 1 et M 2 ; l’accélération de M 3 ne dépend pas de
la masse de M 3. Cette approximation est pertinente étant donné que la masse du satellite est
négligeable par rapport à celles de la Terre et de la Lune (Msatellite ∼ 103 << MLune ∼ 1022
et MT erre ∼ 1024 ).
– Un mouvement particulier est choisi pour M 1 et M 2 : ces deux corps décrivent une trajectoire
circulaire autour de leur centre de masse. L’orbite de la Lune autour de la Terre possède une
excentricté de 0.0549 , ce qui est assez proche d’une orbite circulaire.
– On suppose que le mouvement de M 3 (le satellite) est restreint au plan orbital de M 1 (Terre)
et M 2 (Lune).
Le problème restreint circulaire des trois corps (CR3BP) est d’un intérêt important car il présente
une première approximation utile de beaucoup de problèmes réels. C’est aussi le cas particulier le
plus simple non intégrable du problème des N corps.
2
Équations du mouvement
On considère un satellite soumis à l’attraction de la Terre et de la Lune. On note T~ la force
motrice de l’engin du satellite. L’application du principe fondamental de la dynamique au satellite
dans un repère inertiel I donne :
m3
~ 13
~ 23
~
R
R
d2 R
= −Gm1 m3 3 − Gm2 m3 3 + T~
2
dτ
R13
R23
où :
m1 , m2 et m3 sont les masses respectives de la Terre, la Lune et du satellite,
~ est le vecteur position du satellite,
R
(1)
2
ÉQUATIONS DU MOUVEMENT
3
~ 13 est le vecteur Terre-satellite,
R
~ 23 est le vecteur Lune-satellite,
R
G est la constante de gravitation universelle,
et τ est l’unité de temps.
On ramène le CR3BP à un système sans dimensions. La masse du troisième corps étant négligeable, la masse caractéristique est prise comme la somme des deux masses des primaires M 1 et
M 2, m∗ = m1 + m2 . La longueur caractéristique est la distance entre les deux primaires, l∗ = R12 ,
~ 12 est le vecteur Terre-Lune. Enfin le temps caractéristique τ ∗ est choisi de telle manière que la
où R
constanteq
de gravitation sans dimension G∗ soit égale à 1. Par la troisième loi de Kepler, on conclut
que τ ∗ =
l∗ 3
Gm∗ .
Les définitions précédentes nous mènent aux quantités sans dimensions suivantes :
~r =
~
R
,
l∗
~rij =
~ ij
R
l∗
{i, j} ∈ {1, 2, 3},
µ=
m2
m∗
et t =
τ
.
τ∗
Étant donné que la poussée de l’engin est bornée, on normalise T~ comme suit : T~ = Tmax ~u, où Tmax
est la poussée maximale de l’engin et ~u est le contrôle avec |~u| ≤ 1. Le contrôle ~u est la commande
du moteur de l’engin, à déterminer selon les critères de minimisation.
En divisant l’équation (1) par m3 et en utilisant le nouveau système d’unités on obtient :
d2~r
(1 − µ)
µ
l∗ 2 Tmax
=
−
)
~u
~
r
−
~
r
+
(
13
23
3
3
dt2
r13
r23
m∗ G m3
On pose ε =
Tmax
m3
(2)
et on suppose que le terme qui figure entre parenthèses devant le contrôle est
désormais sous entendu dans le terme ε, en fait, ceci ne nuit pas à l’écriture des équations et ce
terme sera pris en compte dans les calculs numériques.
On se propose d’écrire l’équation (2) dans un repère tournant à la vitesse angulaire de rotation
des deux primaires autour de leur centre de masse, l’origine du repère. Les deux primaires étant
fixes dans ce repère, elles se situent sur l’axe des abscisses : M 1 de coordonnées (−µ, 0, 0) et M 2 de
coordonnées (1 − µ, 0, 0). On prend (x, y, z) comme coordonnées de M 3 dans le repère tournant R.
2
On exprime ( ddt2~r )I en fonction de x, y et z.
(
d2~r
d~r
d2~r
)
=(
)R + 2~
ω × ( )R + ω
~ ×ω
~ × ~r
I
dt2
dt2
dt
(3)
où ω
~ est le vecteur de rotation angulaire de R par rapport à I, ω
~ = ~z dans le nouveau système
d’unités. On a :
~r = x~x + y~y + z~z
d~r
)R = ẋ~x + ẏ~y + ż~z
dt
d2~r
( 2 )R = ẍ~x + ÿ~y + z̈~z
dt
(
2
ÉQUATIONS DU MOUVEMENT
4
On revient à l’équation (3) on obtient :
(
d2~r
)I = (ẍ − 2ẏ − x)~x + (ÿ + 2ẋ − y)~y + z̈~z
dt2
(4)
De plus, on a :
~r13 = (x + µ)~x + y~y + z~z
(5)
~r23 = (x − 1 + µ)~x + y~y + z~z
(6)
En combinant les équations (2), (4), (5) et (6), on obtient un système différentiel contrôlé du second
ordre de dimension 3 :

µ

ẍ = 2ẏ + x − 1−µ
3 (x + µ) − r 3 (x − 1 + µ) + εu1

r13

23
µ
ÿ = −2ẋ + y − 1−µ
y
−
y
+
εu2
3
3
r13
r23


 z̈ = − 1−µ z − µ z + εu
3
r13
3
r23
(7)
3
où (u1 , u2 , u3 ) sont les composantes du contrôle dans R.
Ce système peut être écrit d’une manière plus compacte en introduisant la fonction potentiel
Vµ (x, y, z) = − 1−µ
r13 −
µ
r23
− 12 (x2 + y 2 ), notre système se réduit au suivant :



 ẍ − 2ẏ + Vµ x = εu1
ÿ + 2ẋ + Vµ y = εu2


 z̈ + V = εu
µz
3
où Vµ x =
∂Vµ
∂x ,
Vµ y =
∂Vµ
∂y
et Vµ z =
∂Vµ
∂z .
Remarque. L’écriture des équations du mouvement dans le système sans unités prédéfini précédemment est plus apte aux calculs numériques vu que cela nous offre une mise à l’échelle (scaling)
intrinsèque.
Le mouvement du troisème corps M 3 est restreint au plan orbital des deux primaires, on peut
alors omettre l’équation en z. On pose q = q1 + iq2 = x + iy, le système précédent se ramène à
l’équation suivante dans le plan complexe :
q̈ + ∇Vµ (q) + 2iq̇ = εu
où Vµ (q) = − 1−µ
r1 −
µ
r2
2
− q2 avec r12 = (q1 + µ)2 + q22 et r22 = (q1 − 1 + µ)2 + q22 et u = u1 + iu2 .
"
#
2
2
q̇1 − q2
µ
Si on pose p = q̇ + iq =
et Jµ (q, p) = q̇2 + Vµ (q) = p2 + p1 q2 − p2 q1 − 1−µ
r1 − r2 , on a
q̇2 + q1
alors :
∂Jµ
∂Jµ
q̇ =
, ṗ = −
+ εu.
∂p
∂q
On remarque que si u = 0 (système non contrôlé ou libre), on obtient un système hamiltonien. Le
cas CR3BP contrôlé est donc une perturbation d’un système hamiltonien par un petit paramètre ε.
3
INTÉGRALE DE JACOBI ET RÉGION DE HILL
5
De plus, le système lui même est paramétré par un paramètre intrinsèque µ. En effet, le cas limite
µ = 0 correspond à un problème à deux corps à savoir Terre - satellite, un problème plus simple et
qu’on a déjà étudier auparavant. Pour le système Terre - Lune ; µ = 0.012153 << 1, on peut aussi
donc dire que notre système est un problème à deux corps perturbé par un faible paramètre µ, d’où
l’idée de la continuation 2 - 3 corps évoquée lors de la section 6 du rapport.
3
Intégrale de Jacobi et région de Hill
On reprend le système non-contrôlé écrit à l’aide des deux variables p et q :
q̇ =
∂Jµ
,
∂p
ṗ = −
∂Jµ
.
∂q
On est donc en face d’un système hamiltonien classique. Il est bein connu (et facile à vérifier) que
Jµ (q, p) est constant le long des solutions de ce système. Donc le système (7) (on omet l’équation en
z) posséde l’intégrale première :
E(x, y, ẋ, ẏ) = Jµ (q, p)
= Jµ (x + iy, (ẋ − y) + i(ẏ + x))
=
ẋ2 + ẏ 2
+ Vµ (x, y)
2
Autrement dit, toute solution est telle que :
ẋ2 + ẏ 2
+ Vµ (x, y) = e
2
où e est une constante. En mécanique céleste ou en astronomie, on fait généralement référence à
l’intégrale de Jacobi définie ainsi :
C = −2e.
Aucune autre intégrale première n’est connue.
E(x, y) n’est autre que l’énergie du troisième corps dans le champs d’attraction des deux primaires
(énergie cinétique
ẋ2 +ẏ 2
2
+ énergie potentielle Vµ (x, y)), on parle aussi d’énergie intégrale. Pour une
valeur fixée e de l’énergie, les solutions sont sur une surface dite d’énergie (variété de dimension 3
dans l’espaces des phases de dimension 4). On définit la région de Hill comme suit :
{(x, y) ∈ R2 |Vµ (x, y) ≤ e}.
Elle correspond à la région de mouvement possible pour energie donnée e. La figure 1 visualise
les régions de Hill selon l’évolution de e (e croissante) pour le système Terre-Lune, la région où le
mouvement est autorisé est grisée. Il existe cinq portraits possibles de la région de Hill selon la valeur
de e. On note Ei l’énergie du point de libration Li (cf. section suivante). On a E2 < E1 < E3 <
E4 = E5 . On a alors les configurations suivantes :
3
INTÉGRALE DE JACOBI ET RÉGION DE HILL
−2
−2
−1.5
−1.5
L4
−1
6
L4
−1
−0.5
−0.5
L3
0
L2
L1
L3
0
0.5
L2
0.5
1
1
L5
L5
1.5
2
−2
1.5
−1.5
−1
−0.5
0
0.5
1
1.5
2
2
−2
−2
−2
−1.5
−1.5
L4
−1
−1.5
−1
−0.5
0
0.5
1
1.5
2
1.5
2
L4
−1
−0.5
−0.5
L3
0
L2
L1
L3
0
0.5
L2
L1
0.5
1
1
L5
L5
1.5
2
−2
L1
1.5
−1.5
−1
−0.5
0
0.5
1
1.5
2
2
−2
−1.5
−1
−0.5
0
0.5
1
Fig. 1 – Région de Hill en fonction de e pour µ = 0.012153.
– si e < E2 , M3 ne peut se déplacer qu’autour M 1 et M 2 (figure 1 en haut à gauche).
– si E2 < e < E1 , M 3 peut aussi en plus se déplacer dans la zone entre M 1 et M 2 (figure 1 en
haut à droite).
– si E1 < e < E3 , M 3 peut passer à la zone extérieure via un passage autour de L1 (figure 1 en
bas à gauche).
– si E3 < e < E4 = E5 , M 3 peut passer à la région extérieur via un passage par L3 (figure 1 en
haut à droite).
– si e > E4 = E5 , M 3 est libre de l’attraction de M 1 et M 2.
L’introduction du paramètre ε dans ce système hamiltonien permet de jouer sur la vitesse de
M 3 et permet donc contrôler son energie e. On obtient une énergie fonction du temps e(t) tout au
long du transfert, ceci induit des changements dans la topologie de la région de Hill en fonction du
temps : la dynamique de la région de Hill. Cette dynamique sera traitée ultérieurement dans le cas
du transfert Terre - point L2 .
4
4
POINTS DE LIBRATION
7
Points de libration
De nombreuses études sont faites sur le CR3BP non contrôlé. On traite dans ce paragraphe
quelques propriétés de ce système. On remarque que le système différentiel décrivant le CR3BP
libre est autonome (ne dépend pas du temps) ceci est dû à la formulation du problème dans le
repère tournant. Donc, on peut estimer la présence d’emplacements d’équilibre invariants. De tels
emplacements sont caractérisés par une position et une vitesse stationnaires. Ils sont déterminées en
annulant en même temps l’accélération et la vitesse dans le système suivant :

µ

ẍ = 2ẏ + x − 1−µ
3 (x + µ) − r 3 (x − 1 + µ)

r13

23
µ
y
−
y
ÿ = −2ẋ + y − 1−µ
3
3
r13
r23


 z̈ = − 1−µ z − µ z
3
r13
3
r23
On obtient alors :
µ
1−µ
(xeq + µ) − 3 (xeq − 1 + µ)
3
r13
r23
1−µ
µ
−yeq = − 3 yeq − 3 yeq
r13
r23
µ
1−µ
0 = − 3 zeq − 3 zeq
r13
r23
−xeq = −
(8)
(9)
(10)
L’équation (10) donne zeq = 0, donc tout les points d’équilibre se trouvent dans le plan orbital
contenant les deux primaires. On remarque que, pour r13 = r23 = 1, les deux équations (8) et (9)
sont vérifiées. On obtient ainsi deux solutions dites équilatérales ou triangulaires xeq =
yeq =
√
± 23
1
2
− µ et
car il forment des triangles équilatéraux avec la Terre et la Lune. Il existe aussi trois
autres points d’équilibre situés sur l’axe des abscisses, dits les points colinéaires. Les abscisses de ces
points sont calculées numériquement à partir de l’équation (8) avec yeq = 0 (la résolution de cette
équation reveint à trouver les racines réelles d’un polynôme d’ordre 5). Pour le système Terre-Lune,
µ = 0.012153, on a le point L2 situé entre la Terre et la Lune d’abscisse x2 ' 0.8369, le point L1
situé à droite de la Lune d’abscisse x1 ' 1.1557 et le point L3 situé à gauche de la Terre d’abscisse
x3 ' −1.0051. Ces cinq points sont aussi dits points de libration ou points de Lagrange. La figure
2 montre plus clairement le positionnement de ces points. Dans notre étude, on s’intéresse au point
d’équilibre L2 , vu sa position entre les deux primaires. On essaye de calculer de manière plus précise
son abscisse x2 [7], −µ ≤ x2 ≤ 1 − µ. On reprend l’équation (8) et on substitue yeq par 0 on obtient :
x2 =
1−µ
µ
−
2
(x2 + µ)
(1 − µ − x2 )2
On pose ξ = 1 − µ − x2 , distance entre la Lune et le point L2 , l’équation précédente devient :
−ξ + 1 − µ =
1−µ
µ
− 2
(1 − ξ)2
ξ
(∗)
4
POINTS DE LIBRATION
8
Fig. 2 – Points de libration.
Si on met au même dédominateur, on obtient une équation polynomiale d’ordre 5 dépendant uniquement du paramètre µ :
ξ 5 − (3 − µ)ξ 4 + (3 − 2µ)ξ 3 − µξ 2 + 2µξ − µ = 0
On résout cette équation numériquent à l’aide d’un algorithme de recherche de zéros basique de type
Newton en prenant comme point d’initialisation une valeur très proche de la solution. On détermine
ainsi la valeur numérique de ξ avec une bonne précision (∼ 10−10 ) et puis la valeur de x2 . Une autre
approche permet d’avoir un développement en séries de ξ. En effet, une factorisation judicieuse de
(∗) nous donne :
µ
ξ 3 (1 − ξ + ξ 2 /3)
=
3(1 − µ)
(1 − ξ)3 (1 + ξ + ξ 2 )
1
µ
Une solution en séries de puissance de la quantité ν = [ 3(1−µ)
] 3 est la suivante :
1
1
23
151 4 1 5
ξ = ν(1 − ν − ν 2 − ν 3 +
ν − ν ) + o(ν 7 ).
3
9
81
243
9
Si µ << 1 (cas des systèmes Terre-Lune et soleil-Terre par exemple), on peut écrire :
µ
µ
µ
= (1 + µ + µ2 + µ3 + µ4 + · · · ) ' .
3(1 − µ)
3
3
D’où le développement en séries de ξ en fonction de µ :
µ 1
1 µ 1
1 µ 2
ξ = ( ) 3 (1 − ( ) 3 − ( ) 3 + · · · )
3
3 3
9 3
Remarque. Suite au développement en séries de ξ en fonction de ν, une initialiation judicieuse de
1
µ
l’algorithme de recherche de zéro est tout simplement ν = [ 3(1−µ)
]3 .
5
5
MINIMISATION DU TEMPS DU TRANSFERT
9
Minimisation du temps du transfert
Tout le long de ce paragraphe on se place dans le cas du CR3PB contrôlé. Vu que le mouvement
du satellite est restreint dans le plan orbital Terre-Lune, on omet l’équation en z dans le système
(7) et on le ramène à un système du premier ordre de dimensions quatre. Si on désigne par (x1 , x2 )
la position du satellite et par (x3 , x4 ) sa vitesse, (7) devient :

ẋ1 = x3




 ẋ2 = x4
µ

ẋ3 = 2x4 + x1 − 1−µ
3 (x1 + µ) − r 3 (x1 − 1 + µ) + εu1

r13

23


ẋ4 = −2x3 + x2 − 1−µ
x2 − rµ3 x2 + εu2
r3
13
(11)
23
où
p
(x1 + µ)2 + x22
p
= (x1 − 1 + µ)2 + x22
r13 =
r23
On obtient alors un système de la forme ẋ = F (x, u) avec x = (x1 , x2 , x3 , x4 ) et F (x, u) = F0 (x) +
εF1 (x)u1 + εF2 (x)u2 où
 
 


x3
0
0
 
 


 0 
 0 

 x4
 
 

F0 (x) = 
 2x + x − 1−µ (x + µ) − µ (x − 1 + µ) , F1 (x) =  1  et F2 (x) =  0 .
3
3
1
1
4
1
 
 


r13
r23
µ
1
0
−2x3 + x2 − 1−µ
x
−
x
3
3
2
2
r13
r23
On se propose de déterminer le contrôle u = (u1 , u2 ) de l’engin à chaque instant du transfert de
la GEO jusqu’à l’orbite lunaire désirée en optimisant le temps de transfert tf . On obtient alors le
problème de contrôle opitmal suivant :

Rt

min tf = 0 f dt






 ẋ = F0 (x) + εF1 (x)u1 + εF2 (x)u2
(Pµ,ε )
|u| ≤ 1




x(0) fixé (la GEO)



 c (x(t )) = 0 (une orbite lunaire)
f
f
Comme indiqué dans l’introduction, on utilisera pour résoudre de tels problèmes les méthodes indirectes. On applique donc le principe de maximum de Pontryagin (PMP)[6, 8]. Pour cela, on introduit
l’états adjoind (p0 , p) avec p = (p1 , p2 , p3 , p4 ) et p0 ≤ 0 et on écrit l’hamiltonien du système :
H(x, p, u) = p0 + hp, F (x, u)i
= p0 + hp, F0 (x)i + εhp, F1 (x)iu1 + εhp, F2 (x)iu2 .
On se place dans le cas normal p0 6= 0, on pourra prendre alors dans toute la suite p0 = −1. On
pose Hi = hp, Fi (x)i pour i ∈ 0, 1, 2, H devient :
H(x, p, u) = −1 + H0 + εH1 u1 + εH2 u2 .
5
MINIMISATION DU TEMPS DU TRANSFERT
10
L’application du PMP donne :
∂H
(x, p, u)
∂p
∂H
ṗ = −
(x, p, u)
∂x
u = argmax|v|≤1 H(x, p, v)
ẋ =
= argmax|v|≤1 H1 v1 + H2 v2

Un simple calcul de lagrangien nous donne : u = 
H1
H12 +H22
√ H2 2 2
H1 +H2
√

 si (H1 , H2 ) 6= (0, 0), sinon toute
valeur de u telle que |u| ≤ 1 satisfait la condition de maximisation. L’équation H1 = H2 = 0 définit
ce qu’on appelle surface de commutation de codimension 2. L’hamiltonien après maximisation s’écrit
alors
q
H(x, p) = −1 + H0 + ε H12 + H22
Hors les surfaces de commutations l’hamiltonien est lisse. On appelle extrémale tout couple (x, p)
∂H
vérifiant le système hamiltonien (i.e. (ẋ, ṗ) = ( ∂H
∂p (x, p), − ∂x (x, p))). Dans le cas lisse, ces extrémales
sont dites d’ordre zéro (la courbe (x, p) ne touche pas la surface H12 +H22 = 0). On se propose d’étudier
le comportement des extrémales à un instant t̄ où on a éventuellement H12 (t̄) + H22 (t̄) = 0. On pose
ψ
~
ψ = (H1 , H2 ), le contrôle s’écrit u = |ψ|
si ψ 6= 0. On pose z = (x, p), on a alors ż = H(z)
avec
∂H
∂H
~ = ( (x, p), − (x, p)). On introduit les deux lemmes suivants [3] :
H
∂p
∂x
~
Lemme1. Si F est un champs de vecteurs sur x (z = (x, p), ż = H(z))
et HF = hp, F i alors
d
dt (HF (z(t)))
= {H, HF } où {., .} désigne le crochet de Poisson.
Démonstration.
d
d
(HF (z(t))) = pF (x)
dt
dt
= pF 0 (x) |{z}
ẋ + ṗ F (x)
|{z} | {z }
| {z }
∂HF
∂x
=
∂H
∂p
− ∂H
∂x
∂HF
∂p
X ∂HF ∂H
∂H ∂HF
−
)
(
∂xi ∂pi
∂xi ∂pi
i
= {H, HF }
~
Lemme2. Si F et G sont deux champs de vecteurs sur x (z = (x, p), ż = H(z))
et HF = hp, F i
et HG = hp, Gi alors {HF , HG } = H[F,G] où [., .] désigne le crochet de Lie de champs de vecteurs.
5
MINIMISATION DU TEMPS DU TRANSFERT
11
Démonstration.
{HF , HG } =
X ∂HG ∂HF
∂HF ∂HG
(
−
)
∂x
∂p
∂xi ∂pi
i
i
i
= pG0 (x)F (x) − pF 0 (x)G(x)
= p(G0 (x)F (x) − F 0 (x)G(x))
= hp, [F, G]i
= H[F,G] On revient à notre cas, z étant absolument continu, la fonction ψ admet alors des dérivées presque
partout ψ̇ = (Ḣ1 , Ḣ2 ). On rappelle que H = −1 + H0 + u1 H1 + u2 H2 , H1 = hp, F1 i et H2 = hp, F2 i.
D’après le lemme 1 on a :
Ḣ1 = {H, H1 } = {H0 , H1 } + u2 {H2 , H1 }
Ḣ2 = {H, H2 } = {H0 , H2 } + u1 {H1 , H2 }
or d’après le lemme 2, {H1 , H2 } = H[F1 ,F2 ] = hp, [F1 , F2 ]i = 0 d’où ψ̇ = ({H0 , H1 }, {H0 , H2 }), vu
| {z }
0
que {H0 , H1 } et {H0 , H2 } sont continues alors ψ est C 1 et ψ̇ existe partout. Si ψ̇ = 0 alors
{H0 , H1 } = H[F0 ,F1 ] = hp, [F0 , F1 ]i = 0
et
{H0 , H2 } = H[F0 ,F2 ] = hp, [F0 , F2 ]i = 0,
par suite p ⊥ [F0 , F1 ] et p ⊥ [F0 , F2 ]. On a ψ(t̄) = (H1 (t̄), H2 (t̄)) = (0, 0) donc aussi p ⊥ F1 et
p ⊥ F2 . De plus, dans notre cas, on a Vectx {F1 , F2 , [F0 , F1 ], [F0 , F2 ]} = R4 par conséquent p(t̄) = 0
et H(t̄) = −1 ce qui est absurde car l’hamiltonien est nul tout au long du transfert dans le cas de
la minimisation du temps. Ainsi on vient de démontrer que s’il existe un instant t̄ tel que ψ(t̄) = 0
alors ψ̇(t̄) 6= 0. D’où la proposition suivante [3] :
Proposition. Les contacts éventuels avec la surface de commutation sont d’ordre égal à 1, la
courbe (x, p) traverse la surface H1 = H2 = 0 et au passage le contrôle u tourne d’un angle de π
d’où le terme π-singularité. De plus, le nombre d’instant de commutation est fini.
Démonstration. On a déjà démontré que si ψ(t̄) = 0 alors ψ̇(t̄) 6= 0 (d’où les contacts éventuels
avec la surface de commutation sont d’ordre égal à 1), ψ est donc localement le graphe d’une
fonction à valeurs dans R2 , passant par l’origine et possèdant une tangente en ce point (cf. figure 3).
En conséquence, le quotient
ψ
|ψ|
= u posséde des limites à gauche et à droite en t̄ qui sont opposées,
donc le contrôle tourne d’un angle π au passage par la surface de commutation.
Supposons qu’il existe une infinité d’instants de commutation (ti )i∈N avec ti ∈ [0 tf ] ∀i ∈ N, donc
on peut en extraire une sous suite (tϕ(i) )i∈N convergente de limite t̄. Par continuité de ψ, on a
ψ(t̄) = 0. ψ est C 1 alors lim
i→∞
ψ(tϕ(i) )−ψ(t̄)=0
tϕ(i) −t̄
instants de commutation est fini.
= 0 = ψ̇(t̄) ce qui est absurde ainsi le nombre de
6
CONTINUATION DEUX-TROIS CORPS
12
Fig. 3 – Commutation d’angle π.
6
Continuation deux-trois corps
Après application du PMP, le problème (Pµ,ε ) se ramène à un problème de tir classique (vu qu’on
ne connaît pas p(0)). On est donc amené
! à chercher les zéros de la fonction de tir S définie comme
cf (x(tf ))
. Il est bien connu que cf (x(tf )) = 0 est la condition réalisant
suit : S : (tf , p(0)) 7→
H(tf )
la mise du satellite sur l’orbite désirée, l’équation H = 0 est vérifiée tout au long du transfert à cause
de la minimisation du temps (temps final libre) et l’autonomie du système. En effet [6, 8], d’après
le PMP, comme le temps final tf est libre alors on a max|v|≤1 H(x(tf ), p(tf ), v) = 0. Puis vu que
H est autonome par rapport au temps, on a max|v|≤1 H(x(t), p(t), v) = 0 pour tout 0 ≤ t ≤ tf .
On vient de démontrer que le contrôle u est continu ou continu sauf en un nombre fini de points
(cas où on traverse la surface de commutations) donc on a presque partout H(x(t), p(t), u(t)) =
max|v|≤1 H(x(t), p(t), v) = 0 et comme H est continu alors ∀t ∈ [0, tf ], H(x(t), p(t), u(t)) = 0.
On utilise des algorithmes de recherche de zéros du type Newton qui sont très sensibles au
point d’initialisation. Le choix de l’initialisation doit être ajusté de telle manière que l’algorithme
ne diverge pas. Pour faciliter la recherche de l’initialisation, on utilise des méthodes homotopiques.
L’idée des méthodes homotopiques est de plonger notre problème de départ (Pµ,ε ) dans une famille
de problèmes (Pµ,ε )λ dépendant d’un paramètre λ ∈ [0, 1] telle que pour λ = 0 le problème soit
facile à résoudre et pour λ = 1 nous retrouvons le problème de départ. Nous espérons ainsi lorsque
ce paramètre homotopique parcourt le segment [0, 1], que le chemin des solutions des problèmes (Pλ )
6
CONTINUATION DEUX-TROIS CORPS
13
nous amène à la solution recherchée. Ils existent des méthodes homotopiques discrètes, simpliciales,
différentielles, etc... . On utilise dans notre étude dans un premier temps les méthodes dicrètes.
Cette méthode est appelée aussi continuation discrète. C’est une approche basique qui consiste en
la résolution d’une séquence de problèmes (Pλk ), k = 1 . . . N telle que λ0 = 0 et λN = 1, en utilisant
la solution du problème (Pλk ) comme initialisation pour la résolution du problème (Pλk+1 ). Le pas
de dicrétisation hk = λk+1 − λk est ajusté de la façon suivante : on introduit une tolérence sur la
norme de l’homotopie de tir qui indique la réussite de la convergence (Si la norme de l’homotopie à
la solution est inférieure ou égale à la tolérence on suppose que la solution obtenue est acceptable).
On commence avec h0 = 1 et on essaie de résoudre (P1 ) directement. En cas d’échec de résolution,
on diminue le pas de discrétisation et on recommence de nouveau jusqu’à atteindre λ = 1.
Vu l’expérience que j’ai eue pendant mon stage de master [5] pour les problèmes de transfert
orbital à deux corps et les anciens travaux portant sur la minimisation du temps de transfert [4, 2]
au sein de l’équipe de travail, l’idée est de partir d’un problème à deux corps à savoir la Terre et
le satellite qu’on sait bien résoudre et d’essayer d’arriver à notre problème des trois corps. Ceci
revient tout simplement à supposer au départ que la masse de la Lune est nulle et de considérer une
homotopie sur le paramètre µ : µ(λ) = λµT erre−Lune .
Pour µ = 0, on retrouve un problème à deux corps, pour ce type de problème on utilise un
système de coordonnées plus adéquat dit coordonnées de Gauss modifiées (P, ex , ey , hx , hy , L) où :
• P = a(1 − e2 ) est le paramètre de l’ellipse osculatrice avec a le grand axe de l’ellipse et e
son excentricité ;
• ex = e cos (Ω + ω) avec Ω la longitude du nœud ascendant et ω l’argument du périgée ;
• ey = e sin (Ω + ω) ;
• hx = tan (i/2) cos (Ω) avec i l’inclinaison du plan orbital par rapport au plan équatorial ;
• hy = tan (i/2) sin (Ω) ;
• L = Ω + ω + ν est la longitude cumulée avec ν l’anomalie vraie.
On choisit d’exprimer le contrôle dans le repère mobile (q, s, w) attaché au satellite qui est défini
suivant le vecteur position de l’engin r et le vecteur vitesse v. L’expression du nouveau repère est
alors :
q=
r
,
|r|
s = w ∧ s,
r∧v
w=
.
|r ∧ v|
Par hypothèse, on restreint le mouvement du satellite dans le plan orbital de la Terre et la Lune, on
pourra supposer donc que i = 0 tout au long du transfert et les coordonnées utilisées se réduisent
à x = (P, ex , ey , L), de plus le contrôle est plan donc il est exprimé dans une base de deux vecteurs
6
CONTINUATION DEUX-TROIS CORPS
14
Z
satellite
perigee
v
v
w
equatorial plan
s
k
ω
i
Ω
X
q
r
j
O
S
i
Y
orbit
Fig. 4 – Éléments orbitaux et repère ortho-radial.
(q, s). On prend comme point de départ un point de la GEO circulaire de coordonnées (42.165, 0, 0, π).
Pour des raisons de facilité, on prend comme point d’arrivée un point de l’orbite de la Lune autour
de la Terre, qu’on suppose aussi circulaire, de coordonnées (384.402, 0, 0, libre). Le problème (P0,ε )
s’écrit alors dans le nouveau système de coordonnées :

R tf

 min 0 dt



 ẋ = f0 (x) + ε(u1 f1 (x) + u2 f2 (x))



 |u| ≤ 1
(P0,ε )


 P (0), ex (0), ey (0), L(0) fixés



P (tf ), ex (tf ), ey (tf ) l’orbite lunaire




L(tf ) libre
avec :
r
f0 (x) =
µ
P

0






0


,


0
2
W /P

s
f1 (x) =

s
f2 (x) =
P
µ
P
µ
0

 sin(L)

 − cos(L)

0



,


2P/W

 cos(L) + (ex + cos(L))/W

 sin(L) + (e + sin(L))/W

y
0



,


7
CIBLE L2 - POINTS CONJUGUÉS
15
et
W = 1 + ex cos(L) + ey sin(L),
On remarque que (P0,ε ) a la même forme dans les deux systèmes de coordonnées, l’application du
PMP donne alors un contrôle de même forme. Le fait que L(tf ) est libre nous donne par les conditions
de transversalité pL (tf ) = 0 en plus du fait que H = 0 tout au long du transfert. Notre fonction de
tir s’écrit alors :

SG
P (tf ) − 384.402

 ex (tf )


: (tf , p(0)) 7→  ey (tf )

 p (t )
 L f
H(tf )









Dans la suite des simulations numériques, on prend la masse du satellite m3 égale à 1500Kg. On
se propose de chercher les extrémales de (P0,ε ) pour des faibles valeurs de poussées Tmax (on rappelle
que ε =
Tmax
m3 ).
En effet, les nouvelles missions spatiales s’effectuent avec des moteurs à propulsion
ionique de faibles poussées par exemple pour la mission SMART1 la poussée est de 73.19mN . On
trouve facilement une initialisation adéquate de S G pour Tmax = 60N . Pour aller à des poussées plus
faibles, on introduit une homotopie portant sur la poussée maximale Tmax . On utilise les méthodes
homotopiques dicrètes en partant de Tmax = 60N . On a pu atteindre Tmax = 85mN . La grille
d’initialisations trouvée pour (P0,ε ) dans le repère fixe en coordonnées de Gauss modifiées nous
permet de trouver une grille d’initialisation pour (P0,ε ) dans le repère tournant du CR3BP, en effet,
il suffit de bien écrire les matrices de changement de repères entre le repère tourant cartésien et le
repère définie par les coordonnées de Gauss modifiées et de tenir compte des changement des unités
de mesure.
Remarque. Toutes les simulations numériques effectuées dans cette étude (calcul d’extrémales
et tests d’optimalité) sont faites avec le logiciel COTCOT [1].
7
Cible L2 - Points conjugués
On reprend maintenant le repère tournant du CR3BP et notre homotopie sur le paramètre µ.
Au lieu de viser directement une orbite autour de la Lune, on vise au départ le point d’équilibre L2
ceci pour quatre raisons :
- pour µ = 0, l’orbite de la Lune est confondue avec celle du point L2 ;
- il est plus facile de viser un point qu’une orbite (ensemble de points) ;
- le point L2 est important mathématiquement et physiquement ;
- pour faciliter le calcul numérique par une étape intermédiare.
On suppose qu’on arrive au point L2 avec une vitesse finale nulle (on vise un point de R4 dans
7
CIBLE L2 - POINTS CONJUGUÉS
16
l’espace des phases). La fonction de tir correspondante s’écrit alors

x1 (tf ) − 0.8369

 x2 (tf )


S : (tf , p(0)) 7→  x3 (tf )

 x (t )
 4 f
H(tf )
:









Les premiers tests numériques effectués pour µ = µT erre−Lune ont montré que la conaissannce seule
du tf min (µ = 0) permet de faire converger l’algorithme de tir (on prend des valeurs arbitraires
pour le vecteur adjoint p(0)). Un seul pas d’homotopie est suffisant pour passer des deux corps aux
trois corps. En fait, la connaissance d’une bonne approximation du temps final est le point clé pour
l’initialisation de la fonction de tir. On a pu donc trouver des extrémales solutions de (PµT erre−Lune ,ε )
pour des poussées de 10 et 1N . Cette technique n’est plus valide pour des poussées plus faibles que
1N , pour aller plus loin en poussées faibles, on introduit alors une homotopie sur Tmax partant
de 1N , on a pu atteindre une poussée de 0.17N avec des pas à la fin de l’homotopie de 10−5 N .
On a alors une grille d’initialisation allant de Tmax = 10N jusqu’à Tmax = 0.17N . On présente
des exemples de trajectoires optimales pour différentes poussées dans la figure 5. On remarque que
chacune des trajectoires comporte deux parties : une partie dite keplerienne où le satellite n’est
soumis pratiquement qu’à l’attraction Terrestre, on est en présence pratiquement d’un système à
deux corps, puis une deuxiéme partie où le satellite commence à quitter la zone d’attraction Terrestre
pour atteindre le point L2 .
Le principe du maximum de Pontryagin constitue une condition nécessaire et non suffisante. Pour
vérifier l’optimalité locale de la solution trouvée on teste la conditon du second ordre. Étant donnée
une solution du PMP, on se procure un tube autour de cette solution et on essaye de voir s’il y a
d’autres solutions optimales contenues dans ce tube. On fait ce qu’on appelle le test des points des
conjugués [2].
Définition. (i) Un point conjugué est une valeur critique de l’application exponentielle,
expxi : R × R4 → R4
(t, pi ) 7→ x(t, xi , pi ).
où xi et pi sont les valeurs initiales de x et p. (ii) Le temps du point critique associé s’appelle temps
conjugué.
(iii) On appelle premier temps conjugué d’une extrémale t 7→ x(t, xi , pi ) définie par pi le premier
instant où on atteint un point critique de expxi .
Dans notre cas, vue la condition de minimisation du temps final, on a toujours H = 0 donc l’état
adjoint p est sur une variété de dimension 4 − 1 = 3. On introduit alors la fonction exponentielle
7
CIBLE L2 - POINTS CONJUGUÉS
17
0.5
0.4
0.2
0
0
!0.2
!0.5
!0.4
0
0.2
0.4
0.6
0.8
0.5
!0.4 !0.2
0
0.2
0.4
0.6
0.8
0.4
0.2
0
0
!0.2
!0.4
!0.5
!0.4 !0.2
0
0.2
0.4
0.6
0.8
!0.6
!0.5
0
0.5
Fig. 5 – Trajectoires en temps minimum vers L2 pour 10, 1, 0.5 et 0.17 Newtons (pour les trajectoires
dans le repère fixe de centre la Terre cf. figure 11).
7
CIBLE L2 - POINTS CONJUGUÉS
18
suivante :
expx0 : R × R3 → R4
(t, p0 ) 7→ x(t, x0 , p0 ).
où x0 et p0 sont les valeurs initiales de x et p. L’instant t1c est alors le premier temps conjugué si :
det(Jacexpx0 (t1c , p0 )) = 0 et ∀t < t1c , det(Jacexpx0 (t, p0 )) 6= 0
où Jacexpx0 est la matrice jacobienne de l’application expx0 .
On se propose de calculer la matrice jacobienne de expx0 nécessaire au calcul du premier temps
conjugué.
∂x
∂x
(t, x0 , p0 )
(t, x0 , p0 )]
∂t
∂p0
∂x
= [ẋ(t)
(t, x0 , p0 )]
∂p0
Jacexpx0 (t, p0 ) = [
On considère l’application partielle expx0 (t, .) : p0 7→ x(t, x0 , p0 ), on a expx0 (t, .) = Π ◦ ϕ ◦ j où
(
~
ż = H(z)
ϕ : (t, z0 ) 7→ z(t, z0 ) avec z(t, z0 ) solution du système
, Π : z = (x, p) 7→ x
z(0) = (x0 , p0 ) = z0
et j : p0 7→ z0 = (x0 , p0 ). On a alors :
∂ expx0
∂x
(t, x0 , p0 ) =
(t, p0 )
∂p0
∂p0
dΠ ∂ϕ dj
=
dz ∂z0 dp0
"
#
0
∂ϕ
= [I4 0]
∂z0 I4
(
∂ϕ
∂z0
est solution du système variationnel
~
δ ż = dH(z(t,
z0 )).δz
, l’équation différentielle figurant
δz(0) = I8
dans ce système est dite équation de Jacobi. Un champs de Jacobi est une solution non triviale
J = (δx, δp) de l’équation de Jacobi.
Proposition. [2]On suppose que :
– La forme quadratique
∂2H
∂u2
est définie positive tout au long de l’extrémale ;
– La fonction Ex0 ,t : u 7→ x(t, x0 , p0 ) n’est pas surjective pour tout 0 < t ≤ tf ;
– On n’est pas dans le cas exceptionnel i.e. H0 + H1 u1 + H2 u2 6= 0 le long de l’extrémale.
Sous ces hypothèses, une extrémale est C 0 -localement optimale jusqu’au premier point conjugué.
Le test d’optimalité est alors très simple, il suffit de vérifier que tf < t1c . On pose
"
#
"
# "
#
∂x
δx
0
∂ϕ
∂p0 (t, x0 , p0 )
δz =
=
=
∂p
∂z0 I4
δp
(t, x0 , p0 )
∂p0
7
CIBLE L2 - POINTS CONJUGUÉS
19
δz est de dimension 8 × 4. Étant donnée que H = 0 le long de l’extrémale, p est contenu dans
une variété de R4 de dimension 3. On peut donc réduire δz à trois colonnes au lieu de quatre.
Le test numérique consiste alors à calculer δz par intégration numérique du système variationel et
évaluer, à chaque instant t, det(δx1 (t), δx2 (t), δx3 (t), ẋ(t)). Un temps conjugué tc est détecté lorsque
det(δx1 (tc ), δx2 (tc ), δx3 (tc ), ẋ(tc )) = 0
Les tests de points conjugués sont résumés dans la table suivante :
Tmax
tf min
t1c
t1c /tf min
10
1.470566633802046
2.275078393243948
1.547076032428326
1
8.440118858213319
10.640001984456987
1.260645988901317
0.91
9.771072365657723
12.045026891057153
1.232723128056207
0.83
11.152247725959276
13.500018429122381
1.210519956232514
0.74
13.157672247027882
15.595000128504694
1.185240051258106
0.65
14.369930436233620
16.900006380267907
1.176067375918169
0.53
18.024798634539373
20.700025000258922
1.148419209554621
0.44
21.323275412549972
24.125635629178436
1.131422596313656
0.3
32.216276854781320
35.295058947217477
1.095566042789927
0.1789
51.504129714977552
54.930014374272687
1.066516698335723
D’après cette table, on a toujours tf < t1c ce qui montre que les solutions trouvées sont optimales
localement.
On se propose d’étudier la dynamique des régions de Hill à chaque instant t du transfert, on a
ε 6= 0 donc l’énergie intégrale e du système est une fonction du temps. On rappelle la définition de
la région de Hill à l’instant t :
{(x, y) ∈ R2 |Vµ (x, y) ≤ e(t)}.
Ceci revient à déterminer les régions de l’espace accessibles à l’instant t à partir du point (x(t), y(t))
si on libère le satellite (on met le contrôle à zéro). On visualise sur la figure 6 l’évolution des régions
de Hill (début : instant t1 , milieu : instant t2 et fin du transfert : instant t3 ). Aux trois instants
t1 < t2 < t3 , on associe les trois points P 1 = P (t1 ) = (x(t1 ), y(t1 )), P 2 = P (t2 ) = (x(t2 ), y(t2 ))
et P 3 = P (t3 ) = (x(t3 ), y(t3 )). Pour chaque instant t ∈ {t1 , t2 , t3 }, on trace aussi sur la même
figure une trajectoire contrôlée jusqu’au instant t (en rouge) et une trajectoires libre ou osculatrice
(contrôle nul) à partir de l’instant t (en bleu), le point où on met le contrôle à zéro est marqué
par un astérix sur les figures, il s’agit du point P (t) = (x(t), y(t)) où on calcule l’energie e(t) pour
déterminer la région de Hill à l’instant t. On observe aussi l’évolution de l’énergie intégrale (ou de
Jµ intégrale première du système libre non contrôlé) le long du transfert (cf. figure 7).
La figure à droite en bas de la figure 6 présente plus clairement ce qui se passe à la fin du transfert
(quand le satellite arrive au le point L2 ), en effet, c’est un zoom de la figure juste à coté à gauche.
On remarque que celui-ci ne reste pas longtemps au point L2 mais il est capturé par la Lune. En
effet, le point visé réellement est un point de l’espace des phases (position et vitesse) de dimension 4,
2
0.4
1
7
CIBLE L2 - POINTS CONJUGUÉS
20
0.2
0
0
!1
!0.2
!2
!0.4
!2
!1
0
1
2
!0
2
0.4
0.4
0.2
0.4
0.2
0.4
0
0
0.2
0
0.2
!1
!0.2
0
0
!0.2
1
0.6
0.4
0.2
1
!2
2
!0.4
!0.2
!0.4
!2 !0.6 !1
!0.2
0
0
1
P1
0.22
0.4
!0.6
!0.4
0
P2
!0.2
!0.4
!0.4
!0.2
0
0.2
!0.2
0.4
!0.4
1
2
!0.6
0.4
1
0.2
0.6
0.5
0
0.4
0
!0.2
0.2
!0.5
!0.4
1
!0.4
!0.2
0
0.2
!1
!0.2
0
0
0.4
0.5
1
0.6
0.4
0.2
P3
0
P3
!0.2
0
!0.4
1
!0.4
!0.4
!1
!0.5
0.5 1 1
1.5
0.5 0
0
0.5
Fig. 6 – Trajectoires contrôlées puis osculatrices, régions de Hill (10 Newtons).
0
0.5
1
1
7
CIBLE L2 - POINTS CONJUGUÉS
21
−0.5
−1
−1.5
−2
−2.5
−3
−3.5
−4
−4.5
−5
−5.5
0
0.5
1
t
Fig. 7 – évolution de Jµ le long du transfert (10 Newtons).
1.5
7
CIBLE L2 - POINTS CONJUGUÉS
22
les précisions sur les fonctions de tir aux points finaux est de l’ordre de 10−10 , on n’arrive donc pas
numériquement exactement au point L2 et avec une vitesse nulle. La position d’arrivée non exacte
ainsi que le petit incrément de vitesse amène le satellite à quitter rapidement L2 vers la Terre ou
la Lune selon les signes des petites variations (erreurs) de la position et de la vitesse (δx, δy, δ ẋ, δ ẏ)
autour du point L2 . En effet, ces variations sont régies par l’équation linéarisée du mouvement au
voisinage de L2 :

δ ẋ


0
0

 
 δ ẏ  
0
0

 
 δ ẍ  = − ∂ 2 V (x , 0)
0

  ∂x2 2
∂2V
0
− ∂y2 (x2 , 0)
δ ÿ
|
{z
A
 
0
 

0 1
.

0 2 

2 0
}
1
δx


δy 

δ ẋ 

δ ẏ
La matrice A possède deux valeurs propres imaginaires pures et deux valeurs propres réelles une
positive et une négative. La présence d’une valeur propre positive induit le caractère instable local
de L2 d’où l’explication de la capture du satellite par la Terre ou la Lune lors de son arrivage au
point L2 .
Vu que le problème (Pµ,ε ) dépend de deux paramètres µ et ε (Tmax ), on essaye d’étudier le
comportement des extrémales quand le paramètre µ varie. On prend Tmax = 1N . On introduit une
homotopie sur µ partant de µT erre−Lune jusqu’à 0.5 (cas de deux planétes de mêmes masses). On
présente des exemples de trajectoires optimales pour différentes valeurs de µ dans la figure 8. On
remarque que la partie keplerienne des trajectoires est de plus en plus courte au fur et à mesure
que µ augmente. On fait le test des points conjugués pour les différentes extrémales obtenues pour
différentes valeurs de µ, la table suivante résume les résultats des tests effectués pour une poussée
de 1N :
µ
tf min
t1c
t1c /tf min
0.012153
8.440099825863490
10.635048155422323
1.260061892020842
0.1
7.856528339755506
9.849000000000000
1.253607137157797
0.2
7.276968009437341
9.216352750603498
1.266509999583757
0.3
6.881785501415163
9.072009144753101
1.318263863773078
0.4
6.718500411887269
8.784035369066334
1.307439879519014
0.42
6.713953041575635
8.760003934459252
1.304746083300494
0.45
6.728716837504543
8.736045008301531
1.298322580556301
0.47
6.754134857622678
8.744025382294039
1.294618121583045
0.5
6.823072313018849
8.784011520305938
1.287398274168294
D’après cette table, on a toujours tf < t1c ce qui montre que les solutions trouvées sont optimales
localement.
CIBLE L2 - POINTS CONJUGUÉS
7
23
0.5
0.5
0.4
0.3
0.4
0.2
0.3
0.1
0.2
0
0.1
!0.1
0
!0.2
!0.1
!0.3
!0.2
!0.4
!0.3
!0.5
!0.4
!0.4
!0.2
0
0.2
0.4
0.6
0.8
!0.2
0
0.2
0.4
0.6
0.8
0.5
0.5
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
0
0
!0.1
!0.1
!0.2
!0.2
!0.3
!0.3
!0.4
!0.4
!0.4
!0.2
0
0.2
0.4
0.6
0.8
!0.6
!0.4
!0.2
0
0.2
0.4
Fig. 8 – Altération de la phase quasi-keplerienne µ égal à 0.1, 0.2, 0.3 et 0.5, Tmax = 1N (pour les
trajectoires dans le repère fixe de centre la Terre cf. figure 12).
8
8
CIBLE LUNAIRE - POINTS FOCAUX
24
Cible lunaire - Points focaux
Après l’étude des trajectoires temps minimal vers le point L2 , on s’intéresse à viser maintenant
une orbite autour de la Lune. L’orbite visée est une orbite circulaire de rayon r = 13.084M m = 0.034
en unité normalisée (c’est la valeur du demi grand axe de l’orbite visée dans la mission SMART1).
On écrit les équations caractéristiques de l’orbite finale circulaire :
x21 (tf ) + x22 (tf ) = r2
x23 (tf ) + x24 (tf ) = v 2
x1 (tf )x3 (tf ) + x2 (tf )x4 (tf ) = 0
p
où v est la vitesse du satellite sur l’orbite v = µr . On suppose que le satellite est suffisamment proche
de la Lune, donc son mouvement n’est pas influencé par la Terre. La condition de transversalité du
PMP nous permet d’avoir une quatrième équation reliant x(tf ) et p(tf ) à savoir : x1 (tf )p2 (tf ) −
x2 (tf )p1 (tf ) + x3 (tf )p4 (tf ) − x4 (tf )p3 (tf ) = 0. La fonction de tir dans ce cas s’écrit alors :


x21 (tf ) + x22 (tf ) − r2

 2

 x (tf ) + x2 (tf ) − v 2
4

 3


S : (tf , p(0)) 7→  x1 (tf )x3 (tf ) + x2 (tf )x4 (tf )



 x (t )p (t ) − x (t )p (t ) + x (t )p (t ) − x (t )p (t ) 
2 f 1 f
3 f 4 f
4 f 3 f 
 1 f 2 f
H(tf )
On reprend les vecteurs d’initialisation [tf p(0)] du cas précédent (où on vise le point L2 ). On garde
le même vecteur p(0) et on joue légérement sur le paramètre tf ; on fait varier tf aux alentours de la
valeur trouvée dans le cas précédent. Ceci nous permet de trouver des extrémales pour le cas orbite
lunaire pour des poussées Tmax = 10 et 1N .
Pour vérifier la bonne mise en orbite du satellite, on regarde la trajectoire libre du satellite
après la fin du transfert. On observe qu’il décrit un tube circulaire autour de la Lune (et non une
orbite bien fine). L’explication la plus évidente est le fait qu’on a omis l’influence de la Terre sur le
satellite dans les équations de l’orbite. Pour cela on introduit une homotopie sur le rayon r de l’orbite
partant de 0.034 à des valeurs plus basses. On a des extrémales pour rayons de 0.02, 0.015 et 0.01.
Les trajectoires optimales ainsi que les trajectoires libres après la fin du transfert sont visualisées
sur la figure 9 pour différentes valeurs de r et pour Tmax = 10N . On remarque que le le tube
circulaire décrit par le satellite après la fin du transfert se rétressit au fur et à mesure que r diminue.
Ceci justifie notre hypothèse de départ, vu qu’en se rapprochant de la Lune l’influence de la Terre
diminue.
La technique utilisée pour trouver les initialisations adéquates pour des poussées de 10 et 1N ne
nous permet pas d’aller plus loin pour des plus faibles poussées. On introduit alors une homotopie
sur Tmax partant de 1N et on essaye d’atteindre des poussées plus faibles. Cette homotpie est très
8
CIBLE LUNAIRE - POINTS FOCAUX
25
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
0
0
−0.1
−0.1
−0.2
−0.2
−0.3
−0.3
−0.4
−0.4
0
0.2
0.4
0.6
0.8
1
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
0
0
−0.1
−0.1
−0.2
−0.2
−0.3
−0.3
0
0.2
0.4
0.6
0.8
1
0
0.2
0.4
0.6
0.8
1
−0.4
−0.4
0
0.2
0.4
0.6
0.8
1
Fig. 9 – Différentes cibles lunaires circulaires de rayons r égal à 0.034, 0.02, 0.015 et 0.01, Tmax =
10N (pour les trajectoires dans le repère fixe de centre la Terre cf. figure 13).
8
CIBLE LUNAIRE - POINTS FOCAUX
26
délicate, en fait, on a dû utiliser des pas de 10−7 N . Jusqu’à l’instant de l’écriture de ces lignes, on
a pu atteindre une poussée de 0.8N . On remarque (voir figure 10) qu’on obtient des extrémales de
différentes formes. En effet, l’extrémale effectue un tour de plus atour de la Terre en passant de la
poussée de 1N à 0.9N , entre ces deux poussées, on a des étapes intermédiaires où le satellite n’arrive
pas à faire le tour complet autour de la Terre. Ces extrémales intermédiaire présente des tf min
pratiquement le double de celles correspondant aux poussées de 1 et 0.9N . Le même phénomène se
reproduit entre 0.9 et 0.84N . Ceci pourrait justifier la taille très petite du pas de l’homotopie. La
difficulté lors de cette homotopie discrète nous amène à penser à utliser les méthodes homotopiques
différentielles dans un premier temps pour comparer les deux méthodes puis dans un deuxième temps
pour essayer de mieux comprendre le comportement du chemin de zéros.
Comme dans le cas où l’on vise le point L2 , on teste aussi l’optimalité locale des trajectoires
obtenues. Maintenant on vise un ensemble points (toute une orbite) et non un seul point (point L2 ),
la notion des points conjugués n’est plus alors adaptée et on parle dans ce cas des points focaux
[2], une notion plus générale. Notre cible finale est une orbite circulaire autour de la Lune, une
sous variété M1 de R8 . En vertu du principe du maximum, une extrémale z = (x, p) doit vérifier
la condition de transversalité z(tf ) ∈ M1⊥ . On dit qu’un temps tf oc est focal s’il existe un champs
de Jacobi J = (δx, δp) tel que δx(0) = 0 et J(tf oc ) est tangent à M1⊥ en z(tf oc ) i.e. J(tf oc ) ∈
Tz(tf oc ) M1⊥ . Le test numérique est similaire à celui des points conjugués, par contre, on procéde
par intégration rétrograde (on part de tf ) de l’équation de Jacobi avec J(tf ) ∈ Tz(tf ) M1⊥ comme
condition initiale de l’intégration, le temps tf oc est focal si rg(δx1 (tf oc ), δx2 (tf oc ), δx3 (tf oc )) < 3.
La condition d’optimalité locale devient t1f oc < 0 (premier temps focal négatif). Les tests effectués
sont récapitulés dans la table suivante :
8
CIBLE LUNAIRE - POINTS FOCAUX
27
0.5
0.4
0.4
0.3
0.2
0.2
0.1
0
0
−0.1
−0.2
−0.2
−0.3
−0.4
−0.4
−0.5
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
1.6
0.8
1.4
0.6
1.2
1
0.4
0.8
0.6
0.2
0.4
0.2
0
0
−0.2
−0.2
−0.4
−0.4
−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
1.2
−1.5
−1
−0.5
0
0.5
1
0.4
1.5
1
0.2
0.5
0
0
−0.2
−0.5
−0.4
−1
−1.5
−2.5
−0.6
−2
−1.5
−1
−0.5
0
0.5
1
1.5
2
−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
Fig. 10 – Trajectoires solutions pour cible lunaire circulaire de rayon r égal à 0.034 et pour différentes
poussées Tmax égal à 1, 0.97, 0.96, 0.93, 0.91 et 0.9N (pour les trajectoires dans le repère fixe de
centre la Terre cf. figure 14).
9
CONCLUSION
28
Tmax
tf min
t1f oc
10
1.515693554966947
pas de points focaux
1
9.146635494011267
-19.228067141275645
0.97
9.474160273341
-27.5
0.96
13.100227991760
-21.214509209855947
0.95
14.383235352751
-21.9
0.94
15.520169634928
-27.23
0.93
16.624801498058
-22.16
0.92
17.803899709383
-27
0.91
18.914781658733
-27.3
0.9
10.7987060535816
-38.07
0.89
13.639710938615
-21.565
0.88
15.416426217668
-27.08
0.87
16.724698757257
-27.05
0.86
18.061441083624
-32
0.85
19.465091553847
-27.077888860556541
0.83
14.22770774065
-26.615
0.82
16.372790232075
-27.17
0.81
17.873436170790
-27.160473605132140
0.8
19.491254557340
-27.164961476564521
On remarque alors qu’on a toujours t1f oc < 0 donc les trajectoires trouvées sont bien optimales
localement. La localité du test est bien vérifiée, en effet, il y a des trajectoires qui correspondent à
des minimums locaux et non globaux (par exemple celles pour des poussées entre 0.97 et 0.91N )
mais leurs tests d’optimalité locale sont valides.
9
Conclusion
On a construit une démarche numérique partant du probème à deux corps en coordonnées de
Gauss modifiées (problème de transfert orbital classique qu’on sait résoudre) arrivant au problème
à trois corps en coordonnées cartésiennes dans le repère tournant du CR3BP. Par cette démarche,
on a réussi à calculer numériquement des extrémales temps minimal pour différentes cibles (point
d’équilibre L2 et des orbites autour de la Lune) avec des précisions inférieure à 10−9 . On a aussi
étudié le comportement des extrémales lorsque les paramètres du problème à savoir ε et µ varient.
On a vérifié l’optimalité locale des trajectoires solutions obtenues par des tests de points conjugués
(cible ponctuelle) et points focaux (cible une orbite lunaire). On continuera l’étude pour compléter
les résultats sur le temps minimal : étude des lieux conjugués, étude plus fine du chemin des zéros
dans le cas cible une orbite autour de la Lune, atteinte de poussées plus faibles et tests avec les
10
ANNEXES
29
homotopies différentielles et ensuite on passera à la minimisation de la consommation du carburant.
10
Annexes
A
Repère fixe
On présente ici toutes les courbes des trajectoires solutions dans un repère fixe de centre la Terre.
Dans ce repère, on suppose que la Lune et le point L2 décrivent des orbites circulaires tournant toutes
les deux à la même vitesse de rotation, à savoir celle de Lune par rapport à la Terre. Ces deux orbites
sont visualisées sur les figures suivantes par des cercles noirs (le cercle de plus grand rayon correspond
à celui de la Lune), la croix rouge désigne la Terre, les courbes en bleu sont les trajectoires contrôlées
et celles en vert sont les trajectoires libres après la fin du transfert marquée par ∗.
A
REPÈRE FIXE
30
300
300
200
200
100
100
0
0
−100
−100
−200
−200
−300
−300
−400
−300
−200
−100
0
100
200
300
400
300
300
200
200
100
100
0
0
−100
−100
−200
−200
−300
−300
−400
−300
−200
−100
0
100
200
300
400
−400
−300
−200
−100
0
100
200
300
400
−400
−300
−200
−100
0
100
200
300
400
Fig. 11 – Trajectoire en temps minimum vers L2 pour 10, 1, 0.5 et 0.17 Newtons dans le repère
fixe de centre la terre (pour les trajectoires dans le repère tournant voir figure 5).
A
REPÈRE FIXE
31
300
300
200
200
100
100
0
0
−100
−100
−200
−200
−300
−300
−400
−300
−200
−100
0
100
200
300
400
300
300
200
200
100
100
0
0
−100
−100
−200
−200
−300
−300
−400
−300
−200
−100
0
100
200
300
400
−400
−300
−200
−100
0
100
200
300
400
−400
−300
−200
−100
0
100
200
300
400
Fig. 12 – Altération de la phase quasi-keplerienne µ égal à 0.1, 0.2, 0.3 et 0.5, Tmax = 1N dans le
repère fixe de centre la terre (pour les trajectoires dans le repère tournant voir figure 8).
A
REPÈRE FIXE
32
300
300
200
200
100
100
0
0
−100
−100
−200
−200
−300
−300
−500
−400
−300
−200
−100
0
100
200
300
400
500
300
300
200
200
100
100
0
0
−100
−100
−200
−200
−300
−300
−400
−300
−200
−100
0
100
200
300
400
−400
−300
−200
−100
0
100
200
300
400
−400
−300
−200
−100
0
100
200
300
400
Fig. 13 – Différentes cibles lunaires circulaires de rayons r égal à 0.034, 0.02, 0.015 et 0.01, Tmax =
10N dans le repère fixe de centre la terre (pour les trajectoires dans le repère tournant voir figure
9).
A
REPÈRE FIXE
33
300
300
200
200
100
100
0
0
−100
−100
−200
−200
−300
−300
−400
−300
−200
−100
0
100
200
300
−400
400
−400
−300
−200
−100
0
100
200
300
400
600
300
500
400
200
300
100
200
0
100
−100
0
−200
−100
−300
−200
−400
−300
−500
−400
−300
−200
−100
0
100
200
300
400
500
−600
−400
−200
0
200
400
600
400
300
300
200
200
100
100
0
0
−100
−100
−200
−200
−300
−300
−400
−700
−600
−500
−400
−300
−200
−100
0
100
200
300
−500
−400
−300
−200
−100
0
100
200
300
400
Fig. 14 – Trajectoires solutions pour cible lunaire circulaire de rayon r égal à 0.034 et pour différentes
poussées Tmax égal à 1, 0.97, 0.96, 0.93, 0.91 et 0.9N dans le repère fixe de centre la terre (pour les
trajectoires dans le repère tournant voir figure 10).
RÉFÉRENCES
34
Références
[1] J.-B. Caillau B. Bonnard and E. Trélat. Cotcot - Short reference manual. Technical Rapport
RT/APO/05/1, ENSEEIHT-IRIT, UMR CNRS 5505, 2 rue Camichel, F-31071 Toulouse, March
2005. http ://apo.enseeiht.fr/cotcot.zip.
[2] J.-B. Caillau B. Bonnard and E. Trélat. GEOMETRIC OPTIMAL CONTROL OF ELLIPTIC
KEPLERIAN ORBITS. Discrete and continuous Dynamical Systems-Series B, 5(4) :929–956,
November 2005.
[3] J.-B. Caillau and J. Noailles. COPLANAR CONTROL OF A SATELLITE AROUND THE
EARTH. ESAIM : Control, Optimization and Calculus of Variations, 6 :239–258, February
2001.
[4] Jean-Baptiste Caillau. Contribution à l’étude du contrôle en temps minimal des transferts orbitaux. Thèse de doctorat, Institut National Polytechnique de Toulouse, Toulouse, France, Novembre 2000.
[5] Bilel Daoud. Transfert orbital à faible poussée avec consommation minimale. Rapport de master,
Institut National Polytechnique de Toulouse, Toulouse, France, Septembre 2008.
[6] R.Gamkrélidzé L. Pontryaguine, V. Boltianski and E. Michtchenko. Théorie mathématiques des
processus optimaux. Éditions Mir, 1974.
[7] V. Szebehely. THEORY OF ORBITS The Restricted Problem of Three Bodies. ACADEMIC
PRESS, 1967.
[8] E. Trélat. Contrôle optimal : théorie et applications. Vuibert, 2008.
Téléchargement