Extraction et modélisation de données astrophysiques

publicité
J.-F. Donati
P. Petit, F. Paletou
I: Extraction optimale des spectres
II: Extraction du signal polarimétrique
III: Modélisation des signatures Zeeman
Acquisition instrumentale
• source lumineuse :
lumière au foyer du télescope (Coudé, Cassegrain, Nasmyth)
fibres optiques en provenance d’un foyer du télescope
système de découpeur d’image
• instrument dispersif :
spectrographe à réseau
mono-ordre pour la basse dispersion (R~1,000-5,000)
multi-ordre (dispersion croisée) pour la haute dispersion (R>30,000)
• détecteur :
matrice de capteurs photosensibles (eg CCD) refroidie à l’azote liquide
Exemples d’observations
• fichiers spectres :
pose simple : mesure du spectre non polarisé d’un objet
séquence polarimétrique : mesure du spectre polarisé d’un objet
• fichiers de calibration :
bias :
mesure du fond additionnel géneré par la lecture du
détecteur
dark :
mesure du fond additionnel causé par la pose
flat field : correction des différences de sensibilité entre pixels
estimation de la géométrie des ordres
fabry-perot : recherche des iso-longueur d’onde dans chaque ordre
thorium :
détermination de la relation entre pixels et longueur d’onde
Exemples d’extraction
• étapes :
soustraction du fond (I’ = I - B)
correction des hétérogénéités entre pixel (I’’ = I’ / F/<F>)
mesure et soustraction de la lumière diffusée (I’’’ = I’’ - L)
extraction du spectre 1d (I’’’(x,y)  S(pix) )
normalisation du continu (S’(pix) = S(pix) / Sc(pix))
calibration en longueur d’onde du spectre (S’(pix)  S’’(λ) )
• extraction du spectre :
sommation des pixels perpendiculairement à l’ordre
 limites de la sommation ?
 impacts de particules ?
Principe
• étapes :
on obtient une première estimation du spectre S(λ) (par addition simple)
on divise chaque pixel de l’image I(x,y) = I(x,λ) par le flux total
correspondant à cette longueur d’onde (P(x,λ) = I(x,λ) / S(λ))
on obtient un modèle simple de P(x,λ), par exemple par un fit polynomial
sous la forme P’(x,λ) = a(x) + b(x) λ + c(x) λ2 + ... en éliminant les
points les plus déviants
on ajuste, par expansion, P’ sur I à chaque longeur d’onde pour déduire
le flux total à cette longueur d’onde (V(x,λ) : variance de I(x,λ))
S’(λ) = ∑x [ I(x,λ) P’(x,λ) / V(x,λ) ] / ∑x [ P’(x,λ)2 / V(x,λ) ]
en éliminant itérativement les points les plus déviants
on recommence la boucle plusieurs fois jusqu’à convergence
Justification
• on cherche un estimateur de S(λ) qui soit fonction linéaire des I(x,λ) :
 F = ∑i wi Ii
(on note : S(λ)  S; F(λ)  F; I(x,λ)  Ii; P(x,λ)  Pi; w(x,λ)  wi; V(x,λ)  Vi)
• on veut que F soit un estimateur de S non biaisé : E(F) = S
comme E(F) = ∑i wi E(Ii) et E(Ii) = Pi S
 G(w) = ∑i wi Pi - 1 = 0
• on veut que F soit de variance minimum :
•
•
 H(w) = var(F) = ∑i wi2 Vi minimum
minimisation de H sous la contrainte G = 0
théorème des multiplicateurs de Lagrange :
 il existe µ et w tel que ∇H(w) = µ ∇G(w) et G(w) = 0
 il existe µ et w tel que ∇J(w, µ) = 0 avec J(w, µ) = H(w) - µ G(w)
on trouve:
wi = (Pi/Vi) / ∑i (Pi2/Vi) (et µ = 2 / ∑i (Pi2/Vi))
si Vi ∝ Ii ∝ Pi  wi = 1
Résultats
• propriétés du spectre obtenu par extraction optimale :
c’est l’estimateur (linéaire en Ii) non biaisé et de variance minimum
à fort flux : Vi ∝ Ii ∝ Pi (statistique de Poisson)  wi = 1
 l’extraction optimale est surtout avantageuse à faible flux
à fort flux, elle permet un filtrage efficace des impacts de particules
• plus compliqué, mais résultat similaires, si :
les ordres du spectre sont très courbes pr/ au colonnes du détecteur
les iso-longueurs d’ondes sont inclinées pr/ au lignes du détecteur
Recherche d’un signal moyen
• dans un spectre avec S/B = n, on cherche un signal spectral de taille < 1/n
• exemples de signaux recherchés :
•
•
•
•
décalage spectral des raies (vitesse radiale)
 ∆v = 1 km/s  signal = 0.1
vitesse de rotation (largeur des raies)
 ∆v/v = 0.1  signal = 0.01-0.1
abondance des métaux (largeur équivalente des raies)
 ∆a = 0.1 dex  signal = 0.01
hétérogénéités surfacique de brillance ou d’abondance
 signal = 0.001-0.01
signatures Zeeman des étoiles froides
 signal = 0.0001-0.001
•
• toutes les raies répètent un signal plus ou moins similaire
 extraction simultanée du signal dans toutes les raies du spectres
Extraction par corrélation croisée
• corrélateur analogique :
eg CORAVEL/OHP (1980 - 1995)
on utilise un masque positionné entre le spectre et le photomètre
qui ne laisse passer la lumière qu’à certaines longueurs d’onde
presélectionnées (correspondant aux raies choisies)
et dont on peut changer la position le long du spectre
I(y) = ∫x S(x) M(x-y) dx
•
 mesures d’abondances, vitesses radiales et vitesses de
rotation dans de nombreux amas stellaires
• corrélateur numérique :
eg ELODIE/OHP (1995 - )
la corrélation est faite numériquement a posteriori
•
 detection de la planète 51 Peg
Extraction par déconvolution
• on suppose que les raies répètent un signal G plus ou moins similaire :
•
 D(λ) = 1-I(λ) = ∑i αi G(λ-λi) = ∑i αi ∫u δ(λ-λi-u) G (u) du
•
 D(λ) = M*G (λ)
où M(λ) = ∑i αi δ(λ-λi)
• G s’obtient par déconvolution de D (données) par M (connu)
au sens des moindres carrés, G doit vérifier :
•
 [D(λ) - M*G (λ)]2 / V(λ) minimum
• en utilisant le formalisme matriciel (D dim n, G dim m, M dim nxm, n>>m):
•
•
•
t(D
- M·G)·V-1·(D - M·G) minimum
 tM·V-1·(D - M·G) = 0
 (tM·V-1·M)·G = tM·V-1·D
 G = (tM·V-1·M)-1·(tM·V-1·D)
Résultats
• utilisation simultanée des raies du spectre :
•
•
•
 ~8,000 raies sur 370-1000 nm pour le type spectral K1
 gain d’un facteur ~50 en rapport S/B
 gain équivalent de 8.5 magnitude pr/ au cas d’une raie unique
Problématique
• la signature Zeeman est modulée par la rotation
les signaux migrent dans les raies du bleu vers le rouge
•
 elle est due à un champ magnétique à la surface de l’étoile
• la signature Zeeman est complexe
et montre différentes polarités à chaque phase de la rotation
•
 une modélisation simpl(ist)e du champ n’est pas possible
• la modélisation procède en plusieurs étapes
•
•
 modélisation de la signature Zeeman pour une topologie B donnée
(problème direct)
 reconstruction automatique de B à partir des observations
(problème inverse)
Problème direct
• on divise la surface de l’étoile en cellules infinitésimales
• on calcule la signature Zeeman de chaque cellule dans son propre repère
(eg dans l’approximation des champs faibles) :
Vloc(λ) = k Bz dI(λ)/dλ
• on somme la contribution des régions de l’étoile à une phase donnée
(en tenant compte du décalage Doppler induit par la rotation) :
Vtot(λ) = ∫S Vloc(λ-λD) b dS
• on répète l’opération à toutes les phases
• on a construit la fonction R qui relie l’image I aux données synthétiques F :
F = R(I)
Problème inverse : principe
• on veut reconstruire (par itérations) une image de l’étoile I (dim n)
à partir des données D de variance V (dim m) en évaluant les différences
quadratiques entre D et F (méthode des moindres carrés) :
C(I) = t(F-D)·V-1·(F-D)
• le problème est le plus souvent mal contraint :
•
•
il y a plus de variables que de données (m < n)
le système est dégénéré pour d’autres raisons
 on choisit l’image la plus ‘simple’
pour choisir cette image (et assurer l’uncité de la solution),
on introduit une fonction S appelée entropie :
S(I) = ∑i si où si mesure l’information de la cellule i de l’image I
si = -Ii log(Ii/Idef) pour une image de la brillance
si = -Bri2 - Bθi2 - Bφi2 pour une image magnétique
• on résout le problème S(I) minimum sous la contrainte C(I) = C0
Problème inverse : algorithme
• on minimise la fonctionnelle Lagrangienne S - µ C
•
 on cherche I telle que ∇S(I) = µ ∇C(I)
• on procède par itérations :
et C(I) = C0
on part de l’image d’entropie nulle
on progresse pas à pas le long du chemin ∇S // ∇C
on s’arrête quand atteint C=C0
• à chaque itération, on calcule au point I :
•
•
R telle que Rij = ∂Fj/dIi
∇C(I) = 2 tR·V-1·(F-D) et ∇∇C(I) ~ 2 tR·V-1·R
∇S(I) et ∇∇S(I)
et les développements de Taylor de C et S au voisinage de X :
C(X) = C(I) + t(X-I)·∇C(I) + 1/2 t(X-I)·∇∇C(I)·(X-I)
S(X) = S(I) + t(X-I)·∇S(I) + 1/2 t(X-I)·∇∇S(I)·(X-I)
ce qui permet de calculer la nouvelle image Xµ :
 Xµ = I - (∇∇S(I) - µ ∇∇C(I))-1 (∇S(I) - µ ∇C(I))
Matrice de réponse
• dans le cas de l’imagerie en brillance :
• dans le cas de l’imagerie en champ magnétique :
Exemples d’inversion
• dans le cas de l’imagerie en brillance :
• dans le cas de l’imagerie en champ magnétique :
Téléchargement