Calcul scientifique parallèle

Téléchargement

Frédéric Magoulès

François-Xavier Roux

Cours, exemples avec OpenMP

et MPI et exercices corrigés

Calcul scienti que

parallèle

Lim Magoules.indd 1 20/12/2012 17:46:01

ISBN 978-2-10-058904-3

La série « Mathématiques pour le Master/SMAI » propose une nouvelle génération

de livres adaptés aux étudiants de Master niveau M1 et aux élèves ingénieurs. Leur

adéquation au cursus LMD et aux outils de calcul modernes sont au service de la

qualité scientique.

La SMAI (Société de Mathématiques Appliquées et Industrielles) assure la direction

éditoriale grâce à un comité renouvelé périodiquement et largement représen-

tatif des différents thèmes des mathématiques appliquées et de leur évolution :

analyse numérique, probabilités appliquées, statistique, optimisation, systèmes

dynamiques et commande, traitement d’images et du signal, nance, recherche

opérationnelle, etc. Son ambition est de constituer un ensemble d’ouvrages de

référence.

Les auteurs et l’éditeur ne pourront être tenus responsables des éventuels

problèmes liés à l’utilisation des informations présentes dans ce livre.

Lim Magoules.indd 2 20/12/2012 17:46:14

“doc2” — 2012/12/17 — 11:18 — page iii — #3 i

Table des matières

Avant-propos ix

Introduction xi

1 Architectures des calculateurs 1

1.1 Différents types de parallélisme . . . . . . . . . . . . . . . . . . . 1

1.1.1 Recouvrement, concurrence et parallélisme . . . . . . . . . 1

1.1.2 Parallélisme temporel et spatial pour les unités arithmétiques 3

1.1.3 Parallélisme et mémoire . . . . . . . . . . . . . . . . . . . 5

1.2 Architecture mémoire . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.2.1 Mémoire multi-banc entrelacée . . . . . . . . . . . . . . . 6

1.2.2 Mémoire hiérarchisée . . . . . . . . . . . . . . . . . . . . . 7

1.2.3 Mémoire distribuée . . . . . . . . . . . . . . . . . . . . . . 11

1.3 Architectures hybrides . . . . . . . . . . . . . . . . . . . . . . . . 12

1.3.1 Accélérateurs graphiques GPU . . . . . . . . . . . . . . . . 12

1.3.2 Calculateurs hybrides . . . . . . . . . . . . . . . . . . . . . 13

2 Parallélisation et modèles 15

2.1 Parallélisation............................. 15

2.2 Critères de performance . . . . . . . . . . . . . . . . . . . . . . . . 17

2.2.1 Degré de parallélisme . . . . . . . . . . . . . . . . . . . . 17

2.2.2 Équilibrage des tâches . . . . . . . . . . . . . . . . . . . . 18

2.2.3 Granularité .......................... 19

2.2.4 Extensibilité . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.3 Parallélisme de données . . . . . . . . . . . . . . . . . . . . . . . . 20

2.3.1 Boucles de programmes . . . . . . . . . . . . . . . . . . . 20

2.3.2 Dépendance.......................... 21

2.3.3 Exemples de dépendance . . . . . . . . . . . . . . . . . . . 22

2.3.4 Opérations de réduction . . . . . . . . . . . . . . . . . . . 24

2.3.5 Boucles imbriquées . . . . . . . . . . . . . . . . . . . . . . 25

iii

“doc2” — 2012/12/17 — 11:18 — page iv — #4 i

2.3.6 OpenMP ........................... 28

2.4 Cas particulier : la vectorisation . . . . . . . . . . . . . . . . . . . 30

2.4.1 Calculateurs vectoriels et vectorisation . . . . . . . . . . . . 30

2.4.2 Dépendance.......................... 31

2.4.3 Opérations de réduction . . . . . . . . . . . . . . . . . . . 32

2.4.4 Chaînage des opérations . . . . . . . . . . . . . . . . . . . 33

2.5 Tâches communicantes . . . . . . . . . . . . . . . . . . . . . . . . 35

2.5.1 Programmation par échanges de messages . . . . . . . . . . 35

2.5.2 Gestion de l’environnement parallèle . . . . . . . . . . . . 35

2.5.3 Échanges de messages point à point . . . . . . . . . . . . . 36

2.5.4 Échanges collectifs . . . . . . . . . . . . . . . . . . . . . . 37

Pourallerplusloin.................................... 41

Exercices.................................... 45

Solutions.................................... 47

3 Algorithmique parallèle 49

3.1 Algorithmes parallèles pour les récurrences . . . . . . . . . . . . . 49

3.1.1 Principe de la méthode de réduction . . . . . . . . . . . . . 49

3.1.2 Surcoût et stabilité de la méthode de réduction . . . . . . . 51

3.1.3 Réduction cyclique . . . . . . . . . . . . . . . . . . . . . . 52

3.2 Localisation et distribution : produit de matrices . . . . . . . . . . . 53

3.2.1 Algorithmes par lignes ou par colonnes . . . . . . . . . . . 53

3.2.2 Algorithmes par blocs . . . . . . . . . . . . . . . . . . . . 54

3.2.3 Algorithme distribué . . . . . . . . . . . . . . . . . . . . . 57

3.2.4 Mise en œuvre . . . . . . . . . . . . . . . . . . . . . . . . 58

Pourallerplusloin.................................... 62

Exercices.................................... 63

Solutions.................................... 64

4 Analyse numérique matricielle 67

4.1 Rappels d’algèbre linéaire . . . . . . . . . . . . . . . . . . . . . . 67

4.1.1 Espaces vectoriels, produit scalaire, projection orthogonale . 67

4.1.2 Applications linéaires et matrices . . . . . . . . . . . . . . 70

4.2 Propriétés des matrices . . . . . . . . . . . . . . . . . . . . . . . . 73

4.2.1 Matrices, valeurs propres, vecteurs propres . . . . . . . . . 73

4.2.2 Normes d’une matrice . . . . . . . . . . . . . . . . . . . . 74

4.2.3 Changements de base . . . . . . . . . . . . . . . . . . . . . 76

4.2.4 Conditionnement d’une matrice . . . . . . . . . . . . . . . 77

Pourallerplusloin.................................... 82

Exercices.................................... 84

“doc2” — 2012/12/17 — 11:18 — page v — #5 i

5 Matrices creuses 87

5.1 Origine des matrices creuses . . . . . . . . . . . . . . . . . . . . . 87

5.2 Formation parallèle des matrices creuses : mémoire partagée . . . . 91

5.3 Formation parallèle par blocs des matrices creuses : mémoire distribuée 92

Pourallerplusloin.................................... 95

6 Systèmes linéaires 97

6.1 Méthodes directes . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

6.2 Méthodes itératives . . . . . . . . . . . . . . . . . . . . . . . . . . 98

Pourallerplusloin.................................... 100

7 Méthodes LU 103

7.1 Principe de la décomposition LU . . . . . . . . . . . . . . . . . . . 103

7.2 Factorisation de Gauss . . . . . . . . . . . . . . . . . . . . . . . . 106

7.3 Factorisation de Gauss-Jordan . . . . . . . . . . . . . . . . . . . . 108

7.4 Factorisation de Crout et de Cholesky pour des matrices symétriques 113

8 Méthodes LU pour les matrices pleines 117

8.1 Factorisation par blocs . . . . . . . . . . . . . . . . . . . . . . . . 117

8.2 Mise en œuvre de la factorisation par blocs dans un environnement

de programmation par échanges de messages . . . . . . . . . . . . 121

8.3 Parallélisation de la descente-remontée . . . . . . . . . . . . . . . . 125

Exercices.................................... 128

Solutions.................................... 131

9 Méthodes LU pour les matrices creuses 135

9.1 Structure de la matrice factorisée . . . . . . . . . . . . . . . . . . . 135

9.2 Factorisation symbolique et renumérotation . . . . . . . . . . . . . 137

9.3 Arbre d’élimination . . . . . . . . . . . . . . . . . . . . . . . . . . 142

9.4 Arbre d’élimination et dépendance . . . . . . . . . . . . . . . . . . 146

9.5 Dissections emboîtées . . . . . . . . . . . . . . . . . . . . . . . . . 148

9.6 Descente-remontée . . . . . . . . . . . . . . . . . . . . . . . . . . 152

Pourallerplusloin.................................... 155

Exercices.................................... 158

Solutions.................................... 164

10 Espaces de Krylov 171

10.1 Espaces de Krylov . . . . . . . . . . . . . . . . . . . . . . . . . . 171

10.2 Construction de la base d’Arnoldi . . . . . . . . . . . . . . . . . . 173

Pourallerplusloin.................................... 176

1 / 20 100%

Documents connexes

Exercices d`algèbre linéaire

INFOB123 - Algèbre (1e partie) Descriptif de cours : 2016-2017

IT336 : Architectures des plates-formes parallèles et distribuées

PDF Formation - Cegos E

Système d`exploitation - Hautefort, notre patrimoine

Physique-Maths

LIVRE MARKETING SOMMAIRE

La fin du chemin pour les architectures uniprocesseurs : place au

algèbre linéaire numérique

Cours 5

exercices d`algèbre linéaire

Le parallélisme Du superordinateur au processeur graphique

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d'utilisation

Calcul scientifique parallèle

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Calcul scientifique parallèle

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib