Éthique et économique/Ethics and Economics, 9 (1), 2012
http://ethique-economique.net/
Les réseaux de neurones un outil de sélection
de variables : Le cas des facteurs de risque de
la maladie du cancer du sein
By/Par
Manel Zribi, Younes Boujelbene
Faculté des Sciences Economiques et de Gestion, Université de Sfax, Tunisie
Unité de Recherche en Economie Appliqué
A
BSTRACT
This paper uses the neural networks with an incremental learning algorithm as tool of
selection of the most relevant risk factors in the disease of the breast cancer diagnosis. The
results testify of the relevance of the neuronal approach with an incremental algorithm in
research. An experimental study is performed using simulated data are further validated on
real clinical data for breast cancer diagnosis; it was possible to us to determine the optimal
combination of factors allowing to affect a good predictive performance of the type of tumor.
Keywords: Neural networks, incremental learning algorithm, classifications risk factors.
R
ÉSUMÉ
Ce papier utilise les seaux de neurones avec un algorithme incrémental comme outil de
sélection des facteurs de risques les plus pertinents dans la maladie du cancer du sein. Les
résultats témoignent de la pertinence de l’approche neuronale avec un algorithme
incrémentale dans ce domaine de recherche. A partir d’un échantillon de 248 patientes
atteintes par cette maladie, il nous a été possible de déterminer la combinaison optimale des
facteurs permettant d’atteindre une bonne performance prédictive du type de tumeur maligne
et bénigne.
Mots clés : réseaux de neurones, algorithme incrémental, classification des facteurs de
risques.
JEL Classification: C38
I
NTRODUCTION
Cancer du sein
Éthique et économique/Ethics and Economics, 9(1), 2012,
http://ethique-economique.net/
174
Depuis une dizaine d’années, l’utilisation de réseaux de neurones artificiels (RNA) s’est
développée dans de nombreuses disciplines (sciences économiques, écologie,
environnement, biologie et médecine…). Ils sont notamment appliqués pour résoudre des
problèmes de classification, de prédiction, de catégorisation, d’optimisation, de
reconnaissance des formes et de mémoire associative (Drew et Monson, 2000).
Dans le cadre de traitement de données, les RNA constituent une méthode d’approximation
de système complexes, grâce à leur capacité d’être un approximateur universel, ont prouvé
leur capacité à extraire de données d’expérimentation des modèles performants, sans avoir à
effectuer d’hypothèse sur la forme générale de ces derniers (Thomas Pet G.Bloch, 1999).
Avec les méthodes statistiques traditionnelles, il faut d’abord penser à un modèle, le tester,
penser à un autre jusqu’à ce qu’on obtienne un modèle suffisamment précis. Un réseau est
entrainé sur des données grâce à un mécanisme d’apprentissage qui agit sur les constituants
du réseau pour réaliser au mieux la tâche désirée. La famille de RNA la plus utilisée ces
dernières années comme outil d’aide à la décision est le perceptron multi-couche (PMC).
Ce type de réseau a été appliqué dans l’aide à la décision médicale pour le traitement de
données pour l’anthropologie (Benoit le Blanc et al., 2001), pour la prévision des fractus
(Baxt, 1995), pour le diagnostic des pathologies pulmonaires (Patil et al., 1993), du diabète
(Armoni,1998), des cancers (Han et al., 2001), de la maladie d’Alzheimer (Hamilton et
al.,1997) ,etc.
Ce papier n’est pas destiné à détailler le fonctionnement des réseaux de neurones vu que de
nombreux articles et ouvrages font partie (Davalo et Naim, 1990 ; Bourret et al., 1991 ;
Abdi, 1994 ; Cross et al.,1995), mais nous souhaitons montrer l’intérêt prévisionnel de cet
outil par la sélection des variables (Baxt, 1995).
L
ES RÉSEAUX DE NEURONES ARTIFICIELS
Les RNA sont des modèles d’entrées-sortie basés sur un caractère des neurones biologiques,
le but initial de cette modélisation est de reproduire les capacités du cerveau humain à
interpoler ou à classifier.
Selon (Haykin, 1994), un RNA est un processus distribué de manière massivement parallèle,
qui a une propension naturelle à mémoriser des connaissances de façon expérimentale et de
les rendre disponibles pour utilisation. Il ressemble au cerveau en deux points :
- la connaissance est acquise à travers un processus d’apprentissage
- les poids des connections entre les neurones sont utilisés pour mémoriser la connaissance.
Cancer du sein
Éthique et économique/Ethics and Economics, 9(1), 2012,
http://ethique-economique.net/
175
Fig.1. La structure d'un neurone artificiel (Haykin, S. 1994: Neural Networks)
Les entrées du réseau, notées x
1
, …, x
n
(se sont les variables explicatives du modèle), sont
liées aux cellules de la couche suivante par des poids synaptiques w
nj
déterminant l'effet du
signal par le neurone n sur le neurone j ;
Chaque cellule de la première couche cachée (deuxième couche dans le réseau) va évaluer
l’intensité de l’information qui lui parvient de la couche d’entrée en calculant la somme
pondérée : net
j=
w
nj
x
n
La cellule en question va traiter l’information puis elle va la transmettre aux cellules suivante
à l’aide d’une fonction d'activation ζ qui anime le neurone en déterminant son activation ; et
une activation o
j
équivalente de la sortie de neurone. Elle est égale à: o
j
= ζ (w
nj
x
n
+ Θ
j
)
Θ
j
se
sont des paramètres à estimer généralement à l’aide d’une procédure
d’apprentissage supervisé proposé par (Rumelhart et al 1986) connue sous le nom de
l’algorithme de rétropropagation du gradient. Cet algorithme calcule l’erreur quadratique
qui mesure l’erreur entre la sortie fournie par le réseau et la sortie désirée, mais cet
algorithme introduit le nombre et la connectivité des unités cachées à priori, et termine les
poids par la minimisation d’un coût.
Le réseau obtenu est éventuellement élagué, ce qui en termes d’inférence non paramétrique
qui permet de diminuer la variance (Le Cun et al., 1989, Geman et al., 1992, Hassibi al.,
1993).
Nous constatons alors qu’avec une approche incrémentale on apprend au même temps le
nombre d’unités et les poids, dans le cadre d’une architecture fixée, commençant
généralement avec une seule unité.
Cancer du sein
Éthique et économique/Ethics and Economics, 9(1), 2012,
http://ethique-economique.net/
176
Le perceptron multicouche (PMC)
Le perceptron multicouche (PMC) constitue le réseau le plus utilisé. Il s’agit d’un réseau de
type (feedforward) composé de couches successives, ce type de réseau est très performant
pour les problèmes de classification.
L’idée consiste à regrouper les neurones par couches interconnectées. Une première couche
appelée couche d’entrée est composée d’un certain nombre de neurones dont la tâche est de
recevoir l’information de l’extérieur. Ces informations sont transformées puis transmises aux
neurones de la (ou des) couches intermédiaires qui vont effectuer certains traitement puis
envoyer les résultats vers une dernière couche appelée couche de sortie.
Fig. 2. Le perceptron multicouche (Borret. P 1991 : Réseaux de neurones artificiels)
Devant l’absence de gles théoriques permettant de déterminer l’architecture optimale d’un
réseau de neurones pour une situation particulière, plusieurs auteurs (Mendelson 2001,
Wierenga et Kluytmans 1994, Venugopal et Baets 1994, Shepard 1990) ont proposé des
règles empiriques qui se basent sur un certain nombre d’essais obtenus en faisant varier le
nombre et la taille des couches intermédiaires enfin, il est à noter que quelques tentatives de
détermination automatique de la meilleure architecture ont été proposées.
M
ÉTHODOLOGIE
L’échantillon et les variables retenues
Notre étude porte sur 248 observations des femmes atteintes par la maladie du cancer du
sein.
Les neurones d’entrées correspondent aux variables : épidémiologiques (age, origine, etat
civil, contraception…), cliniques (signes inflammatoires, mamelon, gonglion…), para-
cliniques (mammographie, métastase,…), classification TNM.
Cancer du sein
Éthique et économique/Ethics and Economics, 9(1), 2012,
http://ethique-economique.net/
177
Quand la tumeur est suffisamment grosse, elle devient palpable. Parfois, en regard de la
tumeur, la peau change d'aspect : peau d'orange, peau rétractée, ridée ou d'allure
inflammatoire ; le mamelon peut aussi être déformé, être le siège d'un eczéma ou d'un
écoulement de sang, avoir un aspect croûteux.
Il est aussi possible de découvrir des ganglions, le plus souvent dans l'aisselle.
Des facteurs génétiques peuvent augmenter le risque (Antécédent familiaux): on parle de
gènes de prédisposition ou de risques de développer un cancer du sein. Plusieurs femmes
dans une même famille (mère, grand-mère, tante, sœurs, filles) peuvent présenter un cancer
du sein. La découverte d'un gène pathologique ne fait pas le diagnostic de la maladie, il
indique seulement une élévation du risque de développer un cancer du sein.
Des risques hormonaux : il semble que les femmes ayant une puberté précoce, une
ménopause tardive, n'ayant pas d'enfants ou ayant des enfants tardivement, n'ayant pas
allaité, auraient un risque plus important d'avoir un cancer du sein.
La pilule contraceptive : Pour les contraceptifs oraux (CO), le risque serait un peu plus élevé
(+ 20 %) pour les femmes ayant pris des CO pendant plus de 5 ans avant une première
grossesse, de même
il existe un sur-risque de cancer du sein chez les femmes utilisant un
Traitement Hormonal de la Ménopause estroprogestatif. Ce sur-risque de cancer augmente
avec la durée du traitement.
Antécédents personnels : ont plus de risques que les autres de présenter un autre cancer du
sein dans leur vie (risque de deuxième cancer de 10 %). Elles seront en général suivies
attentivement après.
Les métastases : ce sont des cellules cancéreuses peuvent se détacher de la tumeur mère,
aller dans le sang et se greffer sur des organes à distance et se multiplier pour leur propre
compte.
Classification de la taille tumorale : T0, T1, T2, T3, T4, T4a, T4b, T4c, T4d, Nodule : N0,
N1, N2, N2a, N2b.
La sortie correspond au type de cancer Maligne ou Bénigne.
Une couche cachée liant les entrées au sortie à travers une fonstion d’activation sigmoide :
Architecture du réseau
Cependant, comme pour toute application neuronale, un point crucial de la phase de
modélisation reste la détermination de la structure du seau. En effet, même si les travaux
de (Cybenko, 1989 et Funahashi, 1989) ont montré qu’une seule couche cachée utilisant des
fonctions d’activation de type sigmoïdale était suffisante pour pouvoir approximer toute
fonction non linéaire avec précision voulue, rien n’est dit à priori sur le nombre de neurones
cachées utilisé.
La problématique de la réduction du modèle a été initiée par (Zeigler, 1976) pour qui la
complicité d’un modèle est relative au nombre d’éléments, de connexions et de calculs du
modèle.
1 / 10 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !