Apport du machine learning dans la stratification
du risque cardiovasculaire
École doctorale: EDITE de Paris (ED130)
Domaine: Sciences pour l'ingénieur
Projet
Les maladies cardiovasculaires représentent la première cause de morbi-mortalité dans les sociétés
industrialisées. La compréhension de la physiopathologie sous-jacente inclut une caractérisation précise des
phénotypes cardiaques via des biomarqueurs d?une grande sensibilité, altérés dès le stade pré-clinique (avant
apparition de symptômes). Il existe de nombreux biomarqueurs instantanés ou intégratifs témoignant de
l?atteinte des organes cibles, qui sont issus d?imagerie multimodale ou de dosages biologiques. A elle seule,
l?imagerie génère aujourd?hui plus de 90% de la masse totale de données cliniques. A titre d?exemple, à
l?issue d?un examen d?IRM cardiaque, une imagerie complète du cœur et des grosses artères (aorte) peut
fournir la fonction et la composition des tissus, ainsi que l?hémodynamique du sang circulant. Au décours
d?une IRM cardiaque, nous pouvons grâce à nos méthodologies (traitements d?images automatisés mis au
point au LIB- cf références https://www.lib.upmc.fr/?page_id=352&equipe_id=3) extraire divers
biomarqueurs révélateurs des atteintes cardiaques et artérielles. Pour affiner le diagnostic, les médecins
élaborent un algorithme multiparamétrique intégrant mentalement l?ensemble des données IRM et cliniques.
Cet algorithme reste mental et non systématisé donc subjectif et dépendant de la sensibilité du médecin. Dans
ce contexte, une collaboration avec S Mesmoudi de l?Equipex Martice et de l?Institut des Systèmes
Complexes, J D Zucker de UMMISCO (UPMC/IRD), A Redheuil et P Cluzel du CHU Pitié-Salpêtrière nous
permettra, grâce aux approches d?apprentissage profond (Deep Learning) de faire face à la multiplication des
images et des biomarqueurs quantitatifs. En effet, nous proposons de mettre en place un modèle intégratif de
ces biomarqueurs et un apprentissage sur images pour une caractérisation individualisée des patients. De plus,
une fouille par text-mining de la bibliographie (BiblioGraph) nous permettra de confirmer l?originalité de nos
résultats vis-à-vis de la littérature existante.
Enjeux
1.Sélectionner des groupes de patients avec différentes pathologies cardiaques et métaboliques et des sujets
sains pour lesquels nous disposons d?une IRM cardiaque avec l?ensemble des biomarqueurs mis au point au
LIB. Puis mettre en place un système intelligent ayant pour objective une classification basée sur des réseaux
de neurones pour démontrer la pertinence de nos indices, leur redondance et associations ainsi que leur
capacité à discriminer nos patients. Ainsi, nous proposons d'utiliser une technique d'apprentissage
automatique de grande qualité qui est l'apprentissage profond afin de construire un modèle d'apprentissage
non supervisé ou semi-supervisé et extraire des caractéristiques hiérarchiques. Un graphique profond avec des
couches de traitement multiples, composés de transformations linéaires et non-linéaires multiples sera utilisé
pour réaliser un haut niveau de représentation de nos données.
2.Vérifier et démontrer la pertinence clinique et l?originalité de nos résultats. La plate-forme d'exploration de
texte mise au point par S Mesmoudi et coll et capable d'analyser la littérature pour rechercher des réseaux
existants entre biomarqueurs sera utilisée Il s?agit de générer les liens dans la littérature actuelle en utilisant
les caractéristiques majeures obtenues dans le projet et de déterminer la nouveauté et la pertinence potentielle
des nouvelles relations identifiées.
3.Focaliser sur les techniques d?apprentissage et de reconnaissance de formes afin d?identifier les
manifestations des diverses pathologies sur nos images d?IRM. Cette seconde étape sera menée dans un
premier temps sur des images statiques, puis sur les images dynamiques et enfin sur les images dynamiques
de vélocimétrie (mouvement des parois + vitesse de l?écoulement). On visera dans un premier temps
$LOGOIMAGE 1/2