|199
Prépublication n° 30 |Fascicule n° 2
Séparation aveugle de sources :
estimation du nombre de signaux
et application aux signaux
à phase polynomiale
Olivier Fourt, Messaoud Benidir
Laboratoire des Signaux et Sytèmes, Supélec – Université Paris-Sud
Résumé :
L’estimation du nombre de sources présentes dans un mélange de signaux est un problème asso-
cié à la séparation aveugle de sources qui demeure peu étudié, en particulier pour les mélanges
sous-déterminés. Dans cet article nous montrons que la parcimonie, déjà proposée pour résoudre
les problèmes de séparation sous-déterminés, nous permet également de construire un algo-
rithme d’estimation du nombre de sources. Cet algorithme présente l’intérêt d’être très fiable
même en présence de bruits forts. De plus, il permet de détecter certaines erreurs d’estimations
éventuelles.
Mots-clés : signaux à phase polynomiale, parcimonie, environnements fortement bruité.
1 Introduction
La séparation aveugle de sources est un problème ancien [1, 2, 3] : les premières solutions
efficaces remontent aux années 80 avec des méthodes comme l’Analyse en Composantes
Indépendantes (ICA). Ces méthodes s’appuient souvent sur l’utilisation des cumulants d’or-
dre 4 ou sur la maximisation d’une fonction d’entropie. Elles souffrent cependant de défauts
bien connus : elles ne peuvent séparer deux sources gaussiennes, les statistiques d’ordres
élevés sont très sensibles au bruit et donc ces méthodes sont d’un intérêt réduit pour les cas
de bruit fort (SNR faible). Enfin ces méthodes résolvent mal les problèmes sous-déterminés :
l’hypothèse d’indépendance des sources utilisée est insuffisante lorsqu’il y a plus de sources
que de capteurs.
L’utilisation de la propriété de parcimonie développée dans les années 90 dans les
travaux en compression des signaux [4] [5] [6] a permis de fournir une solution efficace aux
Olivier Fourt, Messaoud Benidir
« Séparation aveugle de sources : estimation du nombre de signaux et application aux signaux à phase polynomiale »
Schedae, 2007, prépublication n° 30, (fascicule n° 2, p. 199-206).
200 |
problèmes sous-déterminés ainsi qu’aux problèmes sur-déterminés plus simples [7] [8] [9]
avec l’analyse en composantes parcimonieuses (SCA : Sparse Component Analysis). Cette
méthode offre en outre une forte résistance au bruit additif aussi bien pour la puissance du
bruit que pour la nature éventuellement non gaussienne de ce dernier (bruit impulsif).
À la tâche classique de séparation aveugle des sources est rattaché un autre problème
peu étudié et qui fait l’objet de cet article : l’estimation du nombre de sources présentes
dans un mélange lorsque cette donnée est inconnue. Ce sujet n’a pas fait l’objet de beau-
coup d’attention dans la littérature car dans la situation la plus étudiée, le cas sur-déterminé
(nombre de capteurs supérieur au nombre de sources), le rang de la matrice d’auto-
corrélation des signaux capteurs est théoriquement égal au nombre de sources. Pour un
problème sous-déterminé, cette propriété n’est plus utilisable. Nos travaux ont porté sur
l’exploitation de la propriété de parcimonie déjà utilisée pour résoudre le problème de sé-
paration de sources afin de concevoir un algorithme d’estimation du nombre de sources qui
présente en plus une robustesse à la puissance du bruit comparable à celle de l’algorithme
SCA.
Cet article comporte trois parties. La partie 2 sert à poser le cadre du problème. La
partie 3 donne les détails de la procédure d’estimation du nombre de sources, une section
étant consacrée à l’algorithme proprement dit et une autre aux simulations. La partie 4
introduit la méthode permettant de détecter une éventuelle erreur de surestimation du
nombre de sources et les solutions possibles pour la corriger. L’algorithme a été testé avec
des Signaux à Phase Polynomiale (SPP) à valeurs réelles et d’amplitude constante, vaste
classe de signaux non-stationnaires dont nous rappelons la définition ci-après.
s(t) = αcos p
X
k=0
βktk!αR+, βkR, k = 0 . . . p (1)
2 Cadre du problème
Définition 1Un signal g(k)k= 1,...,K est dit parcimonieux si pour presque toutes les
valeurs de kon a : g(k) = 0.
En pratique, il n’est pas nécessaire d’être aussi restrictif : nous considérons comme parci-
monieux un signal dont la majeure partie des points ne peuvent être distingués du bruit
additif ou bien sont de très faible amplitude.
Nous utilisons un mélange de sources linéaire instantané affecté de bruit additif. Les
sources sont des SPP dont les phases sont des polynômes de degrés et de coefficients in-
connus.
x(k) = As(k) + b(k) k = 1 ...N
xRpsignaux capteurs,
sRnsources parcimonieuses distinctes,
bRpbruit additif gaussien,
ARp×nmatrice de mélange instantané
Cette matrice doit être de rang égal à sa plus petite dimension. Il faut en outre que tous les
vecteurs colonnes soient indépendants deux à deux. Dans le cas contraire cela signifie que
deux sources sont « alignées » du point de vue des directions de la matrice de mélange et
en ces circonstances, l’algorithme va considérer ces deux sources comme une seule. La sé-
parations des autres sources ne pose alors pas de difficultés vis-à-vis de ce point ci. Comme
la résolution d’un problème de séparation de sources est toujours soumise à une double
Schedae, 2007, prépublication n° 30, (fascicule n° 2, p. 199-206).
|201
Fig. 1: Mélange de trois SPP, plan x1/x2.
indétermination – permutation et facteur d’échelle – nous avons choisi de normaliser les
vecteurs colonnes de la matrice de mélange.
Les SPP ne sont pas parcimonieux dans le domaine temporel, il faut agir par l’intermé-
diaire d’une transformation linéaire qui les rend parcimonieux. Les représentations temps-
fréquence concentrent l’énergie d’un SPP le long de sa fréquence instantanée. Cette pro-
priété combinée aux performances analogues des décompositions en ondelettes nous a
conduit à choisir une décomposition des signaux étudiés sur des paquets de cosinus lo-
caux.
Propriété 1Pour une transformation linéaire Tet un mélange linéaire instantané bruité
x=As +bnous avons :
T(x) = AT(s) + T(b)(2)
L’essentiel du travail est donc en fait effectué sur le modèle suivant :
X=AS+B
X=T(x)
S=T(s)
B=T(b)
3 Estimation du nombre de sources
Dans un mélange, lorsque toutes les sources sont parcimonieuses, la probabilité que chaque
échantillon des capteurs soit la contribution d’une source et d’une seule est très élevée. En
conséquence, dans l’espace engendré par les signaux capteurs, les points vont avoir ten-
dance à se regrouper suivant des droites colinéaires avec les vecteurs colonnes de la matrice
de mélange et il y a autant de groupements que de sources (ou bien le double si l’on con-
sidère séparément une direction et son opposée) [10] [7] [11]. Ce fait est déjà exploité dans
l’algorithme SCA pour estimer la matrice de mélange et ainsi permettre la résolution du
problème. Dans la méthode proposée ci-après dans cet article nous combinons un algo-
rithme de classification et un critère de sélection de modèle pour estimer le nombre de
groupements et donc le nombre de sources du mélange. La figure 1 présente la dispersion
des points dans l’espace des capteurs d’un mélange de 3 SPP avec 2 capteurs.
3.1 Algorithme
Décomposition sur une base de paquets de cosinus locaux des signaux capteurs pour
obtenir y.
y=T(x)
Schedae, 2007, prépublication n° 30, (fascicule n° 2, p. 199-206).
202 |
Seuillage des coefficients d’ondelettes pour ne conserver que des points significatifs
provenant isolément de chaque source et assurer un débruitage fort. On obtient alors
le signal yt(k) ; le paramètre σest pris égal à 6 fois l’écart-type empirique de |y(k)|.
ksi ky(k)k< σ alors yt(k) = 0
sinon yt(k) = y(k)
(3)
Normalisation des données et sélection des points non-nuls.
ksi kyt(k)k 6= 0 alors d(k) = yt(k)
kyt(k)k(4)
Pour chaque nombre de source possible, on estime une matrice de mélange à l’aide
de l’algorithme de classification FCM (Fuzzy C Means) appliqué aux Lpoints du
tableau de données d(k) k= 1 . . . L. Comme pour chaque source on peut obtenir
une direction et son opposée, on effectue une optimisation pour un nombre de
groupement égal au double du nombre supposé de sources. L’algorithme FCM four-
nit parmi ses résultats le paramètre Ob(i)valeur finale du critère d’optimisation pour
un nombre supposé de isources.
Sélection du nombre optimal de sources nopt à l’aide d’un critère similaire aux critères
de sélection bayesiens et déterminé empiriquement pour pcapteurs. Une limite maxi-
male est fixée égale à 2ppour tenir compte des limites d’utilisation pratique de notre
algorithme SCA, en particulier pour de faibles SNR [11], et pour éviter des erreurs
d’estimation du nombre de sources supérieures à 5%.
nopt = min
iOb(i) + L
35 tanh ((ip)×1.5 ) log(i)(5)
3.2 Simulations
L’algorithme d’estimation du nombre de sources a été testé de manière empirique avec
différents SPP et pour différents niveaux de bruit gaussien. Dans cet article nous ne présen-
tons que les résultats réalisés avec deux capteurs. Les signaux sont échantillonnés à une
fréquence de 106Hz et traités avec un filtre anti-repliement de Butterworth d’ordre 8 coupant
à4×105Hz. Les signaux utilisés sont des SPP d’ordre non fixé allant de 1 à 3. Leurs
paramètres sont générés aléatoirement (hormis l’amplitude constante) pour que leurs fré-
quences instantanées soient comprise entre 7×104Hz et 2.5×105Hz (problèmes de fréquen-
ces négatives ou supérieures à la fréquence de Nyquist sur l’intervalle de temps considéré).
La matrice de mélange est crée pour que les sources soient equi-réparties dans l’espace.
Une perturbation circulaire uniforme comprise entre 0et 2πest ajoutée à chaque source
afin de garantir une invariance des résultats par rotation. L’algorithme est alors appliqué
pour estimer le nombre de signaux dans des mélanges réalisés avec successivement 2, 3 et
4 sources. Chaque expérience a été renouvelée 20000 fois avec du bruit additif gaussien de
moyenne nulle pour des SNR de 71dB,11dB,5dB,0dB et 3dB. Nous n’avons pas cherché
à tester l’algorithme avec des SNR plus faibles car nos travaux passés [11] nous montrent
que l’algorithme SCA utilisé ensuite pour la séparation ne fonctionne alors plus.
Les résultats sont présentés comme suit : le tableau 1 fournit le taux de sur- et de sous-
estimation du nombre de sources quelque soit le nombre exact de signal inclus dans le
mélange pour les différents SNR. Le tableau 2 présente le taux d’erreurs d’estimations pour
chaque groupe de mélange (2, 3 et 4 sources) pour les différents SNR. Nvest le nombre
exact de sources, Nest est le nombre estimé.
Le tableau présentant les taux de sur- et de sous-estimation du nombre de sources
amène quelques constats : Le taux d’estimation correcte (0) est excellent et à peu près
Schedae, 2007, prépublication n° 30, (fascicule n° 2, p. 199-206).
|203
````````
`
SNR Nest Nv-2 -1 01 2
71 dB 0.12 0.975 97.965 0.47 0.47
11 dB 0.152 0.86 98.068 0.452 0.468
5 dB 0.105 0.675 98.027 0.725 0.468
0 dB 0.052 0.392 97.907 1.078 0.571
-3 dB 0.02 0.265 97.085 1.812 0.818
Tab. 1: Taux de sur- et sous-estimation du nombre de sources.
XXXXXX
X
SNR Nv2 3 4
71 dB 1.695 1.455 2.955
11 dB 1.69 1.295 2.81
5 dB 1.87 1.96 2.09
0 dB 2.24 2.81 1.23
-3 dB 3.245 4.715 0.785
Tab. 2: Taux d’erreurs d’estimation du nombre de sources.
constant, de l’ordre de 98% et ses légères fluctuations ne semblent pas devoir être con-
sidérées comme significatives. La répartition des erreurs de sur- et de sous-estimation est
asymétrique en fonction du SNR : pour des SNR élevés les deux taux sont comparables, au
fur et à mesure que le SNR diminue, il y a une prédominance des erreurs de surestimation.
Ce point est important car ainsi que nous le verrons dans la partie suivante, il est possible
de détecter et de corriger ces erreurs.
Le tableau présentant les taux d’erreurs d’estimations en fonction du nombre exact de
sources mérite quelques remarques : les performances pour les mélanges de 2 ou 3 sources
sont du même ordre de grandeur. Le taux d’erreurs d’estimation pour les mélanges à 4
sources s’améliore lorsque le SNR diminue. Cette performance n’est que la conséquence
du nombre maximal de sources dans les mélanges à savoir 4 : les seules erreurs possibles
sont celles de sous-estimation or nous avons vu précédemment que celles-ci diminuent en
proportion lorsque le SNR diminue. A contrario les mélanges de 2 sources ne peuvent au
pire que déboucher sur des erreurs de surestimation et donc une augmentation du taux
d’erreurs avec le SNR.
4 Erreurs de surestimation
Notre algorithme a pour but de fournir une estimation du nombre de sources présentes
dans un mélange afin de pouvoir appliquer ensuite un algorithme SCA pour séparer enfin les
sources. Lorsqu’une erreur de surestimation se produit c’est à dire l’estimation d’un nombre
de sources supérieur au nombre réel, l’algorithme SCA fournit une possibilité intéressante
de détection de l’erreur a posteriori.
Cette détection est réalisée comme suit : après la phase de séparation mais avant la
reconstruction des signaux sources réalisée en inversant la décomposition en ondelettes,
nous calculons un paramètre estimant la dispersion des coefficients d’ondelettes.
Définition 2Soit Sri(k, l)la décomposition en paquet de cosinus locaux de la source re-
constituée sri. Le paramètre hsiest défini comme la moyenne des écart-types empiriques
de kSri(k, l)kcalculés pour chaque niveau de décomposition.
la source reconstituée sricorrespond à un signal effectivement présent dans le mélange,
le paramètre hsicorrespondant a une valeur supérieure à 1. Lorsque la source reconstituée
srine correspond pas à un signal présent dans le mélange (signal en trop), le paramètre hsi
correspondant a une valeur inférieure à 1, souvent inférieure à 0.8. Un simple test permet
Schedae, 2007, prépublication n° 30, (fascicule n° 2, p. 199-206).
1 / 8 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !