Sylvie Hamel Département d`informatique et de recherche

publicité
Bin1002 – Automne 2015
Intégration biosciences/informatique
Sylvie Hamel
Département d’informatique et de recherche opérationnelle
André-Aisenstadt: 3161
[email protected]
Guillaume Lettre
Institut de Cardiologique de Montréal, Faculté de Médecine
[email protected]
http://esilbac1.esi.umontreal.ca/~dbin1002/
Horaire et locaux:
Activité
théorie
Jour
Mercredi: 10h30-12h30
Local
Z-255
Travaux
pratiques
Vendredi: 11h30-13h30
M-625
BIN1002-Université de Montréal
Plan de cours
2
Objectifs: Le cours BIN1002 vise à introduire l’étudiant au
domaine de la bioinformatique en y survolant plusieurs thèmes
importants.
Contenu:
• Structure et prédiction de gènes
• Alignement local et global
• Recherche de similarités
• Introduction au séquençage de deuxième génération
• Transcriptomique
• Médecine personnalisée
BIN1002-Université de Montréal
Plan de cours
3
Qu’est-ce que la bio-informatique?
Champs multi-disciplinaire qui utilise des méthodes informatiques
(mathématiques, statistiques, combinatoires…) pour résoudre un
problème biologique:
Formaliser des problèmes de biologie moléculaire;
Développer des outils formels;
Analyser les données;
Prédire des résultats biologiques;
Organiser les données.
Discipline relativement nouvelle, qui évolue en fonction des
nouveaux problèmes posés par la biologie moléculaire.
Pas de consensus sur la définition de la bio-informatique.
BIN1002-Université de Montréal
Plan de cours
4
Quelques références:
1) D. Gusfield, Algorithms on Strings, Trees, and Sequences,
Cambridge University Press, 1997.
2) D.W. Mount, Bioinformatics: Sequence and Genome Analysis,
Second Edition, Cold Spring Harbor Laboratory Press, 2004.
3) R.D.M. Page et E.C. Holmes, Molecular Evolution, A
Phylogenetic Approach, Blackell Publishers, 1998
4) M. Pop, S.L. Salzberg et M. Shumway, Genome Sequence
Analysis: Algorithms and Issues, IEEE, 2002
5) Etc.
Un invité:
1) Sébastien Lemieux (IRCM) – transcriptomique – 28 octobre
BIN1002-Université de Montréal
Plan de cours
5
Démonstrateur: Robin Milosz
Tâches:
• Travaux pratiques
• Correction des 2 devoirs
• Page web
• Aide à la préparation des fichiers « powerpoint » pour les
présentations
Disponibilités:
• sur rendez-vous
(email: [email protected])
BIN1002- Université de Montréal
Plan de cours
6
Disponibilité des professeurs:
• Sylvie Hamel et Guillaume Lettre:
sur rendez-vous (via email)
•STUDIUM (GL)
BIN1002- Université de Montréal
Plan de cours
7
Plagiat:
• Pour vos travaux, vous pouvez utiliser tout ce qui est
disponible et accessible publiquement en autant que les
références utilisées soient proprement citées.
• Les cas de plagiat seront traités conformément aux règles
en vigueur à l’Université de Montréal
BIN1002- Université de Montréal
Plan de cours
8
Évaluation:
2 devoirs:
• Pondération: 10 % chacun
• Discussions permises
• TP1: - remise de l’énoncé: 18 septembre
- remise du devoir: 9 octobre
• TP2: - remise de l’énoncé: 16 octobre
- remise du devoir: 6 novembre
Tout retard dans la
remise des travaux
entraînera une
pénalité de 10% par
jour (24 heures).
Intra:
• Pondération: 20 % 14 octobre
Test récapitualtif:
• Pondération: 30 % 16 décembre
BIN1002-Université de Montréal
Plan de cours
9
Évaluation (suite):
Présentation:
• Pondération: 30%
• Vous devez remettre un résumé de 2 pages +
une page de bibliographie du sujet choisi le 16
octobre (10%)
• Vous devez remettre un plan de votre
présentation (première version de votre
présentation) (ppt, ps ou pdf) le 9 novembre (5%)
• La présentation de chaque sujet sera d’une
durée de 20 minutes. L’exposé sera suivi d’une
dizaine de minutes de questions. (15%)
• Format:
• Conseil:
BIN1002-Université de Montréal
Il est important de préparer un exposé qui
couvrira l’aspect biologique, la définition
des concepts, les problèmes les plus
intéressants liés au sujet choisi et l’apport
de la bioinformatique.
Il est primordial de commencer ce travail
dès la semaine prochaine.
Plan de cours
10
Évaluation (suite):
Présentation:
• Préparation:
• Lecture de la documentation conseillée
(articles de revue, chapitres de livre, etc.)
• Recherche d’informations supplémentaires
(web: google, NCBI, parrain)
• Faire la présentation avec PowerPoint ou
Acroread
• Emprunter un portable à la DGTIC (si
nécessaire)
BIN1002-Université de Montréal
Plan de cours
11
Évaluation (suite): Présentation:
• Sujets:
• Calcul moléculaire (SH)
• Dynamique moléculaire (SH)
• Génomique Comparative (SH)
• microARN et détection d’ARN non codants
(SH)
• Phylogénomique (SH)
• Algorithmes d’identification d’isoformes à partir de
données RNAseq (GL)
• Algorithmes d’alignment pour les courtes
séquences de NGS (GL)
• Bio-informatique et le nuage (“cloud computing”)
(GL)
•Outils de recherche et d’annotation du génome
humain: UCSC Browser ou ENSEMBL (GL)
• Pubmed: votre meilleur ami! (GL)
BIN1002-Université de Montréal
Plan de cours
12
Calcul moléculaire
Utiliser des molécules biologiques (habituellement ADN) pour
réaliser des calculs et stocker de l’information
01001110111110
BIN1002-Université de Montréal
ACGTTGACGTAG
Plan de cours
13
Calcul moléculaire
L’espace occupé par une billes représente environ 10 billions de
molécules d’ADN
Comme toutes ces molécules peuvent travailler en parallèle, on
peut en théorie avoir 10 billions de calculs exécutés en même
temps dans un très petit espace …
BIN1002-Université de Montréal
Plan de cours
14
Dynamique moléculaire
Simulation d’une molécule dans le temps
Pourquoi?
- Déterminer la structure des biomolécules
Autres méthodes: Crystallographie,
Résonnance magnétique nucléaire, etc.
http://www.gradschool.usciences.edu/faculty/pophristic-vojislava
- Déterminer le mouvement interne des molécules
- Structure + dynamique = fonction
BIN1002-Université de Montréal
Plan de cours
15
Génomique Comparative
Définition (wiki): La génomique comparative est l'étude
comparative de la structure et fonction des génomes de différentes
espèces. Elle permet d'identifier et de comprendre les effets de la
sélection sur l'organisation et l'évolution des génomes.
Gènes conservés entre l’homme et la souris
Nature 409, 860-921(15 February 2001)
BIN1002-Université de Montréal
Plan de cours
16
Génomique Comparative
www.bioalgorithms.info
Question: Peut-on expliquer le scénario d’évolution qui a
permis ce changement d’ordre et d’orientation
des gènes entre ces deux chromosomes?
BIN1002-Université de Montréal
Plan de cours
17
microARN et détection d’ARN non codant
miARN:
Historique: Existence rapportée pour la première fois en 1993
RC Lee, RL Feinbaum et V Ambros, « The C. elegans heterochronic gene lin-4
encodes small RNAs with antisense complementarity to lin-14 », Cell, vol. 75,
1993, p. 843-854
Courtes séquences d’ARN simple-brin propre aux cellules
euchariotes (~ une vingtaine de nucléotides)
Régulateurs post-transcriptionnels capables d’extinction de
l’expression d’un gène
ARN non condant: ARN issu de la transcription qui ne sera pas
traduit en protéine par les ribosomes
Exemples: miARN, ARN nucléaire, ARN interférents, etc.
BIN1002-Université de Montréal
Plan de cours
18
Phylogénie
Phylogénie: Étude des relations de parenté entre être vivants
Arbre universel du vivant – Haeckel 1866
BIN1002-Université de Montréal
Plan de cours
19
Construction d’arbres
Méthodes de distances:
- Entrée: ensemble de distances (ex: distance d’édition)
- Problème: Construire l’arbre de phylogénie en “accord” avec cet
ensemble de distances
Méthodes de parsimonie:
- Arbres qui explique l’évolution des espèces par un nombre
minimal de mutations.
Méthodes de maximum de vraisemblance:
- Méthode probabiliste permettant de trouver la séquence de
nœuds internes la plus probable
BIN1002-Université de Montréal
Plan de cours
20
« Genome browser »
BIN1002-Université de Montréal
Plan de cours
24
PubMed
BIN1002-Université de Montréal
Plan de cours
23
Bio-informatique et cloud
computing
BIN1002-Université de Montréal
Plan de cours
23
Alignement de courtes séquences
d’ADN
BIN1002-Université de Montréal
Plan de cours
23
Détection d’isoformes par analyse
RNA-seq (transcriptomique)
BIN1002-Université de Montréal
Plan de cours
23
Téléchargement