Rapport Stage R Shiny

Telechargé par jamal.achalhi
Développement d’une applicaon R Shiny pour l’analyse
de données omiques
Rapport de stage
Réalisé par
Jamal ACHALHI
Encadrant de stage
Nicolas PECH
Référente universitaire
Bénédicte GASTINEAU
Laboratoire d’accueil : UMR 1467 RECOVER AMU INRAE
Campus Saint Charles, Marseille, FRANCE
Master 1 Mathémaques Appliquées et Sciences Sociales – Analyse des
populaons Année académique 2023 – 2024
2
Remerciements
Je ens à remercier Thomas WILLER, dont l’aide a été précieuse dans l’obtenon du stage.
Je remercie également tous les enseignants du master MASS POP, qui ont su être à l’écoute et
se rendre disponible au cours de cee première année de Master.
Je ens aussi à remercier tous les membres de l’équipe de l’INRAE pour m’avoir permis d’avoir
un cadre scienque smulant et un environnement posif.
Je remercie Benedicte GASTINEAU, mon enseignante référente, concernant sa présence et sa
bienveillance durant le déroulement du stage.
Je remercie parculièrement Nicolas PECH, enseignant sur plusieurs unités d’enseignement
de cee première année et encadrant de ce stage, pour son suivi et ses qualités pédagogiques
et scienques.
3
Résumé
Ce stage, eectué au sein du laboratoire UMR RECOVER (INRAE – Aix-Marseille Université), avait pour objecf
le développement d’une applicaon R Shiny desnée à l’analyse de données omiques issues d’études
généques sur des populaons de poissons.
Dans le cadre de ce projet, j’ai d’abord pris en main un jeu de données génomiques comportant des
informaons sur des SNP (Single Nucleode Polymorphisms), puis j’ai réalisé un traitement complet des
données : véricaon, recodage, geson des valeurs manquantes et ltrage selon diérents seuils.
Lapplicaon que jai développée permet aux chercheurs d’eectuer, de manière intuive, des analyses
stasques avancées, notamment des Analyses en Composantes Principales (ACP) selon la méthode de
Paerson et al. (2006), an de visualiser la structure généque des populaons étudiées.
Ce travail m’a permis de mere en praque mes compétences en stasque appliquée, programmaon R, et
visualisaon de données, tout en découvrant le domaine de la bio-informaque.
Le stage s’est conclu par la créaon d’une applicaon fonconnelle et interacve, appelée à être améliorée et
enrichie pour une ulisaon élargie par les biologistes du laboratoire.
Abstract
This internship, carried out at the UMR RECOVER laboratory (INRAE – Aix-Marseille University), aimed to
develop an R Shiny applicaon for the analysis of omic data derived from genec studies on sh populaons.
The project involved processing a genomic dataset containing SNP (Single Nucleode Polymorphism)
informaon, including data vericaon, recoding, handling of missing values, and ltering according to dened
thresholds.
The developed applicaon enables researchers to perform advanced stascal analyses, notably Principal
Component Analysis (PCA) using the Paerson et al. (2006) method, to visualize and interpret genec
populaon structures.
This internship allowed me to apply my knowledge in applied stascs, R programming, and data visualizaon,
while gaining valuable experience in the eld of bioinformacs.
The work resulted in a funconal and interacve applicaon, which will connue to evolve to beer meet the
needs of researchers.
4
Table des matières
Laboratoire d’accueil : UMR 1467 RECOVER AMU INRAE ...................................................................................... 1
Remerciements ....................................................................................................................................................... 2
Résumé .................................................................................................................................................................... 3
Abstract ................................................................................................................................................................... 3
Glossaire .................................................................................................................................................................. 6
I- Présentaon du laboratoire et déroulement du stage ........................................................................................ 7
I.1 Structure......................................................................................................................................................... 7
I.2 Objecfs ......................................................................................................................................................... 7
I.3 Déroulement du stage ................................................................................................................................... 8
II- Introducon ........................................................................................................................................................ 8
Objecf du stage ............................................................................................................................................. 8
III- Présentaon des données et du logiciel R Shiny ............................................................................................... 9
III.1 Les données .................................................................................................................................................. 9
III.1.1 Qu’est-ce qu’une donnée Omique ? ...................................................................................................... 9
III.1.2 Nos données ........................................................................................................................................ 10
III.1.3 Liste des staons étudiées .................................................................................................................. 10
III.1.4 Illustraon de nos données ................................................................................................................. 11
III.2 Présentaon de R shiny .............................................................................................................................. 12
IV- Descripon du programme de base ................................................................................................................ 13
IV.1 Traitement des données ............................................................................................................................. 13
IV.2 Étude des données manquantes ................................................................................................................ 14
IV.3 Filtrage des données .................................................................................................................................. 15
IV.4 Analyse en Composantes principales ......................................................................................................... 15
IV.5 Précisions sur l’ACP de Paerson ................................................................................................................ 16
IV.5.1 Objecf ................................................................................................................................................ 16
IV.5.2 Aspect Stasque : .............................................................................................................................. 16
IV.5.3 Aspect informaque : .......................................................................................................................... 18
V- Développement et structure de mon applicaon............................................................................................. 21
V.1 Programmaon :.......................................................................................................................................... 21
V.1.1 Interface ulisateur .............................................................................................................................. 21
V.1.2 Serveur ................................................................................................................................................. 23
V.2 Résultats : .................................................................................................................................................... 25
5
Conclusion ............................................................................................................................................................. 27
Bibliographie ......................................................................................................................................................... 28
1 / 28 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!