Estimation d’état pour les drones aériens
Philippe Martin
Centre Automatique et Systèmes
MINES ParisTech
75272 Paris Cedex 06, France
Erwan Salaün
Decision and Control Laboratory
School of Aerospace Engineering
Georgia Institute of Technology
Atlanta GA 30332-0150, USA
Résumé - Ce papier fait un (petit) tour d’horizon des problèmes d’estimation d’état dans le cadre des
(mini)-drones aériens ; il aborde la question sous l’angle à la fois des algorithmes et de l’information
qu’on peut tirer des capteurs les plus courants, en particulier accéléromètres et gyroscopes.
Mots-clés - Robots volants, fusion multi-capteurs, capteurs inertiels, observateurs, filtre de Kalman
INTRODUCTION
L’estimation de l’état (ou plus exactement de l’orientation et du vecteur vitesse) est primordiale pour
le bon fonctionnement des drones aériens, en particulier à voilure tournante. En effet ces drones sont
instables en boucle ouverte ; pour les piloter facilement, a fortiori pour les faire fonctionner de manière
autonome (pilotage manuel “assisté” à distance en retour vidéo, suivi automatique de waypoints, évitement
d’obstacles, etc.), il est donc nécessaire de les stabiliser par un algorithme de commande en boucle fermée,
algorithme qui utilisera forcement de manière directe ou indirecte une estimation de l’état. De nombreux
capteurs sont susceptibles d’être utilisés : capteurs inertiels (c’est-à-dire gyroscopes et accéléromètres),
GPS, magnétomètres, capteurs de pression, télémètres, radar Doppler, systèmes de vision, etc., chacun avec
ses avantages et inconvénients. Les informations provenant des différents capteurs sont ensuite fusionnées
en temps réel avec un modèle dynamique du système par l’algorithme d’estimation, afin de fournir (une
estimation de) l’état du drone. Il y a une vaste littérature sur le sujet, en particulier dans le domaine
aéronautique et spatial, cf par exemple [1], [2]. Le contexte des (mini)-drones soulève néanmoins une
problématique spécifique et assez nouvelle : du fait du degré d’autonomie escompté mais de la faible
charge emportable, l’avionique (capteurs et processeurs) doit être à la fois sophistiquée et très légère, et
au total assez différente de ce qui est utilisée dans l’aéronautique.
Ce papier tente d’aborder de manière synthétique les différents choix et compromis qui se posent pour la
conception d’estimateurs, à la fois en termes de capteurs, de fonctionnalités et d’algorithmes d’estimation.
Il est organisé comme suit : la section I présente les équations du mouvement qui seront utilisées,
ainsi qu’une discussion sur les différents capteurs envisageables ; la section II fait un tour d’horizon
des méthodes d’estimation de type “observateur” (au sens de l’Automatique) ; enfin, la section III étudie
plusieurs cas concrets d’estimation d’état pour les drones.
I. MODÈLE DU MOUVEMENT ET DES CAPTEURS
A. Équations du mouvement
On assimile le drone à un corps rigide, sur lequel agissant le poids et les forces aérodynamiques. Le
Principe Fondamental de la Dynamique permet d’écrire
m˙
~
VC=m~g +~
F(1)
˙
~σC=~
MC,(2)
mest la masse du corps, ~
VCla vitesse du centre de masse C,~σC:= R~
CM ×˙
~
CM(M)le moment
cinétique en C,~
Fla résultante des forces aérodynamiques, et ~
MCleur moment en C;~σCdépend
essentiellement du vecteur vitesse de rotation ~
.
En toute rigueur, un drone aérien est toujours constitué de plusieurs corps. L’approximation corps rigide
est néanmoins valable pour un drone à voilure fixe, les volets de contrôle étant de masse négligeable par
rapport à la masse de l’ensemble. Un drone à voilure tournante peut également être assimilé à un corps
rigide car les parties en rotation ne modifient pas la position du centre de masse ; il faut juste rajouter les
équations de moments supplémentaires correspondant aux parties en rotation.
On considère ici que la Terre est plate, ne tourne pas, et constitue un repère galiléen ; on suppose de
plus que la gravité est constante. Ces hypothèses sont tout à fait justifiées dans le cadre de l’estimation
de l’état d’un mini-drone aérien, cf section (III-A).
Pour avoir un modèle complet, il faut rajouter à (1)-(2) les équations cinématiques reliant la position à
la vitesse de translation ~
VC, et l’orientation à la vitesse de rotation ~
. L’orientation du “repère avion” lié
au drone par rapport au “repère Terre” lié à la Terre peut être décrite soit par les angles d’Euler φ, θ, ψ
(roulis, tangage, cap), soit par un quaternion. On utilisera la représentation par quaternion, qui est bien
adaptée à la fois pour la conception et l’analyse théoriques d’un estimateur et pour l’implémentation sur
un calculateur. Les quelques propriétés des quaternions strictement nécessaires sont rappelées section I-B.
Pour le problème d’estimation de la vitesse et de l’orientation, on aura uniquement besoin de la relation
cinématique entre l’orientation et la vitesse de rotation, et de l’équation des forces (1), c’est-à-dire de
˙q=1
2qω(3)
˙
V=A+qf
mq1.(4)
On a ici projeté (1) dans le repère Terre (alternativement, on aurait pu utilisé le système équivalent obtenu
en projetant (1) dans le repère avion). On a utilisé les notations suivantes :
qest le quaternion représentant l’orientation du corps par rapport au repère Terre
ωest la projection de ~
dans le repère avion
Vest la projection de ~
VCdans le repère Terre
A= (0,0, g)Test la projection de ~g dans le repère Terre (avec la convention North-East-Down)
fest la projection de ~
Fdans le repère avion.
B. Quaternions
On peut voir un quaternion pcomme le couple p= (p0, ~p)Tformé d’un scalaire p0Ret d’un
vecteur ~p R3. Le produit (non-commutatif) de deux quaternions s’écrit alors
pq:= p0q0~p ·~q
p0~q +q0~p +~p ×~q.
On étend le produit vectoriel aux quaternions par la formule p×q:= ~p ×~q =1
2(pqqp). Tout scalaire
p0Rpeut être vu comme le quaternion (p0,~
0)T, et tout vecteur ~p R3comme le quaternion (0, ~p)T. Les
quaternions de norme non-nulle forment un groupe dont 1est l’élément neutre, et (pq)1=q1p1.
À tout quaternion qde norme 1est associée une matrice de rotation RqSO(3) par q1~p q=Rq·~p
pour tout ~p R3;qpeut ainsi représenter l’orientation d’un corps rigide.
Si qdépend du temps, alors ˙q1=q1˙qq1. Si qvérifie l’équation différentielle ˙q=qu+vq
avec u, v R3, alors kq(t)k=kq(0)kpour tout t.
Si qest un quaternion de norme 1“proche” de 1, sa différentielle δq autour de 1est un vecteur de R3.
En effet, q2
0+q2
1+q2
2+q2
3= 1 implique q0δq0+q1δq1+q2δq2+q3δq3= 0, d’où δq0= 0.
C. Principaux capteurs utilisés dans les mini-drones aériens
On fait ici un bref survol des capteurs couramment utilisés dans les (mini)-drones aériens. Pour plus
de détails, consulter par exemple [1], chap. 4 pour les capteurs inertiels et chap. 6-7 pour le GPS.
Un capteur fournit toujours une mesure imparfaite, entachée de bruit, biais, etc. On ne considère ici que
des capteurs “parfaits” ; on verra sections (III-B)-(III-C) des exemples de modélisation d’imperfections ;
on rappelle d’ailleurs qu’un des rôles d’un observateur est de filtrer les bruits de mesure.
1) Capteurs inertiels: Un gyroscope triaxial (c’est-à-dire trois gyroscopes 1 axe montés orthogonale-
ment) idéal mesure ω, projection de la vitesse de rotation ~
dans le repère avion.
Un accéléromètre triaxial idéal accroché au point Pmesure a, projection dans le repère avion de
l’accélération spécifique ~a := ˙
~
VP~g du point P. Si l’accéléromètre est situé au centre de masse C(c’est
souvent le cas en pratique), il mesure donc d’après (1) la projection de ~a =˙
~
VC~g =1
m~
F, c’est-à-dire f
m.
Si Pest différent de C, la mesure est plus difficile à exploiter puisque ~a =1
m~
F+˙
~
×~
CP +~
×(~
×~
CP )
et qu’il faut donc prendre en compte l’équation des moments. Si on ne s’intéresse pas à l’expression de f,
on peut par contre toujours utiliser à la place de (3)-(4) les relations
˙q=1
2qω(5)
˙
V=A+qaq1,(6)
Vdésigne la projection dans le repère Terre de ~
VP(au lieu de ~
VC) ; en effet (6) est simplement la
projection de ~a := ˙
~
VP~g, et (5) ne dépend pas du point du solide où est accroché le gyroscope.
On peut très grossièrement séparer les capteurs inertiels en deux catégories : ceux de classe inertielle qui,
après une éventuelle procédure de calibration, sont très “précis” (ou plus exactement leurs caractéristiques
sont très stables au cours du temps), et les autres ! Les capteurs de classe inertielle sont lourds et très
chers, mais permettent de faire de la “véritable” navigation inertielle, cf III-A. Les capteurs MEMS utilisés
dans les mini-drones aériens ne sont pas de classe inertielle.
2) Magnétomètres: Un magnétomètre triaxial mesure la projection du vecteur champ magnétique
terrestre dans le repère avion, c’est-à-dire q1Bq.Best fixe par rapport à la Terre, mais dépend de la
latitude et (un peu) de l’altitude ; par exemple Bvaut (à un facteur près) environ (1,0,0)Tà l’équateur,
et environ (1
2,0,1
2)Tà la latitude de Paris. Le champ magnétique Terrestre est faible, et facilement
perturbé par les masses ferro-magnétiques locales et autres effets électro-magnétiques. En particulier, il
peut être nécessaire de compenser les perturbations dues au drone lui-même. Les mesures en intérieur ou
près de bâtiments sont à manipuler avec précaution.
Dans le contexte des mini-drones, le magnétomètre sera donc souvent un capteur d’appoint, dont on
limitera l’usage à l’estimation du cap.
3) GPS: un “capteur” GPS reçoit en permanence les signaux émis par les satellites du système GPS et
peut ainsi mesurer sa “pseudo-distance” par rapport aux satellites et le décalage de son horloge interne :
ces informations “brutes” sont ensuite traitées pour en extraire les “solutions de navigation”, c’est-à-dire la
position et la vitesse V(exprimée dans le repère Terre), en général par un EKF. On notera que la vitesse
fournie est toujours de bonne qualité, car elle utilise l’information de l’onde porteuse reçue (phase/décalage
Doppler), information qui est utilisée pour la position seulement dans les modules “haut de gamme”.
La gamme de prix est très large, même pour les modules embarquables dans un mini-drone : par exemple
un module GPS “haut de gamme” avec toutes les options (Javad 1TR-G2T, multi-bande, 55x40mm, 34g,
update rate 100Hz) coûte environ 10 000USD. Mais quelque soit la qualité du module GPS, il doit par
son principe même de fonctionnement voir en permanence au moins 4 satellites. Ce n’est pas forcément
le cas en milieu urbain dense, ni a fortiori dans un bâtiment.
1. www.javad.com
4) Autres capteurs utilisés dans les mini-drones:
capteurs de pression, afin d’avoir une estimation de l’altitude barométrique. La résolution est au mieux
de quelques dizaines de centimètres et dépend à cette échelle fortement des conditions locales, ce
qui en fait une mesure parfois difficile à exploiter dans un drone près du sol. La voilure tournante
peut aussi perturber sérieusement la mesure de pression
télémètres à ultrasons, afin d’avoir une estimation de l’altitude par rapport au sol. La portée est
limitée à quelques mètres, avec une bande passante d’autant plus faible que la distance est grande
(à cause du temps de propagation de l’onde ultra-sonore)
systèmes de vision, qui permettent d’obtenir des informations de et d’orientation. Ce sont évidemment
bien plus que de simples capteurs. C’est un domaine prometteur et qui n’en est sans doute qu’à ses
débuts. La principale limitation des systèmes de vision est la bande passante, en général trop limitée
(du fait de l’important traitement algorithmique nécessaire) pour qu’ils puissent être utilisés seuls.
5) Capteurs peu utilisés dans les mini-drones: les capteurs de vitesse couramment utilisés en avionique
(sonde Pitot ou anémomètre ; radar Doppler) n’existent malheureusement pas à l’heure actuelle en version
embarquable sur un mini-drone.
On n’utilise pas non plus d’inclinomètres, pour la bonne raison que ça n’existe pas ! Un capteur vendu
sous le nom d’“inclinomètre” n’est en général qu’un accéléromètre (souvent bas de gamme), qui sous
l’hypothèse d’une accélération nulle, fournit après filtrage les angles de roulis et tangage ; un AHRS (cf
section III-B) peut être vu comme un inclinomètre sophistiqué.
6) Le rôle important des capteurs inertiels: en guise de conclusion, on insiste sur le fait que les capteurs
inertiels MEMS sont et resteront probablement très utilisés dans les mini-drones : ils sont très légers et peu
chers ; ils fournissent une information avec une bande passante largement suffisante pour l’asservissement
d’un drone, disponible en toute circonstance, et non perturbée par l’environnement externe. Dans un
système multi-capteurs, cf section III, ils fournissent une bonne information “court terme”, tandis que les
capteurs de “haut niveau” avec une bande passante plus faible (GPS, vision) fournissent une information
de recalage “long terme”.
II. ESTIMATEURS,OBSERVATEURS,OBSERVABILTÉ,ETC.
A. La notion d’observateur
Soit le système
˙x=f(x, u)(7)
y=h(x, u),(8)
x, u, y sont dans un ouvert de Rn×Rm×Rp; plus généralement xpeut être dans une variété (c’est-
à-dire une surface généralisée), par exemple l’espace des quaternions. Les signaux y, u sont supposés
connus jusqu’à l’instant courant t: la sortie yest mesurée par des capteurs, l’entrée uest mesurée et/ou
connue en tant que signal de commande.
De manière très générale, un estimateur de (7)-(8) est un processus qui produit à tout instant tune
estimation ˆx(t)tendant vers x(t)à partir des signaux connus y(τ), u(τ); 0 τt. Dans la suite on
se restreindra à la notion un peu plus particulière d’observateur, à savoir un système dynamique
˙z=F(z, u, y)(9)
ˆx=G(z)(10)
vérifiant les deux propriétés suivantes :
si y=h(ˆx, u)dans (9), alors ˆx(t), u(t)est solution de (7), c’est-à-dire
G0(z)· Fz, u, hG(z), u=fG(z), upour tous z, u (11)
ˆx(t)x(t)quand t+.
La première condition dit que si l’estimation est exacte à un certain instant, alors elle l’est aussi à tous
les instants suivants ; la deuxième dit que l’estimation se rapproche asymptotiquement de la vraie valeur.
On note qu’un observateur est un “filtre" non-linéaire : l’estimation fournie est le résultat d’une
intégration, ce qui a pour effet bénéfique de “lisser" les bruits qui entachent inévitablement les signaux
réels. Par ailleurs on se limite à des observateurs continus, mais on peut étendre ce qui est dit à des
observateurs discrets (en pratique on ne peut implémenter sur un calculateur que des observateurs discrets :
on peut soit concevoir un observateur directement en discret, soit discrétiser un observateur continu).
Sous des conditions très générale (Gest de rang maximum n) on peut (localement) considérer que
z= (ˆx, P )et réécrire (9)-(10) sous la forme
˙
ˆx=F(ˆx, u, y, P )(12)
˙
P=G(ˆx, u, y, P ).(13)
Papparait alors comme un vecteur de paramètres régi par la deuxième équation ; on dira que l’observateur
est à gains constants quand Pest constant, et que cette deuxième équation n’est donc pas présente. Par
ailleurs la première condition permet d’écrire
˙
ˆx=f(ˆx, u) + g(ˆx, u, y, P )
˙
P=G(ˆx, u, y, P ),
gˆx, u, h(ˆx, u), P = 0 pour tout ˆx, u, P . Un observateur apparait ainsi comme la recopie du système
˙x=f(x, u)modifié par le terme “correctif" g(ˆx, u, y, P )dépendant du paramètre P. C’est la forme qu’on
considérera dans la suite.
On peut définir plusieurs types de convergence :
convergence globale :ˆx(t)x(t)pour toute condition initiale (x0, u0,ˆx0, P0)
convergence locale autour de toute trajectoire :ˆx(t)x(t)pour toute condition initiale (x0, u0,ˆx0
x0, P0). On peut aussi restreindre P0à démarrer près d’une valeur raisonnable, par exemple telle que
Gˆx0, u0, h(x0, u0), P00
– convergence locale autour de tout point d’équilibre :ˆx(t)x(t)pour toute condition initiale
(x0, u0,ˆx0, P0)(¯x, ¯u, ¯x, ¯
P)(¯x, ¯u, ¯
P)vérifie f(¯x, ¯u)=0et G¯x, ¯u, h(¯x, ¯u),¯
P= 0
convergence locale autour d’un point d’équilibre : soit (¯x, ¯u, ¯
P)un triplet tel que f(¯x, ¯u)=0et
G¯x, ¯u, h(¯x, ¯u),¯
P= 0 ;ˆx(t)x(t)pour toute condition initiale (x0, u0,ˆx0, P0)(¯x, ¯u, ¯x, ¯
P).
Clairement, convergence globale convergence locale autour de toute trajectoire convergence locale
autour de tout point d’équilibre convergence locale autour d’un point d’équilibre.
La convergence locale autour de toute trajectoire est une propriété souvent largement satisfaisante
en pratique ; le fait que ˆx0x0entraine gˆx0, u0, h(x0, u0), P00, c’est-à-dire que la trajectoire de
l’observateur démarre près de la trajectoire à estimer. La convergence locale autour de tout point d’équilibre
ne garantit le fonctionnement de l’observateur que pour des trajectoires “molles", c’est-à-dire telles que
f(x, u)0; les conditions vérifiées par (¯x, ¯u, ¯
P)entrainent que (¯x, ¯u)est un point d’équilibre de (7) et que
(¯x, ¯
P , ¯u)est un point d’équilibre de (12)-(13). La convergence locale autour du point d’équilibre déterminé
par (¯x, ¯
P , ¯u)entraine évidemment la convergence locale autour de tout point d’équilibre déterminé par
(¯x0,¯
P0,¯u0)(¯x, ¯
P , ¯u).
Le problème de l’observateur est largement ouvert du point de vue mathématique : étant donné un
système quelconque (7)-(8), on ne sait en général pas en construire un observateur qui convergerait
globalement, ni même seulement localement autour de toute trajectoire. On sait par contre toujours
construire un observateur qui converge localement autour de tout point d’équilibre (et donc a fortiori
autour d’un point d’équilibre donné) : on se ramène en effet par approximation au premier ordre au cas
1 / 17 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !