34 / L’EMBARQUÉ / N°4 / 2013
Application Médical
Martin Danzer,
responsable
Produits
Congatec.
Répondre aux exigences
de l’imagerie médicale
avec un module COM Express
Les systèmes embarqués conçus pour être utilisés dans des applications médicales
nécessitent un affichage et un traitement d’image de haute performance. Avec les APU
(Accelerated Processing Unit) d’AMD embarquées sur des modules processeurs COM
Express de congatec, les développeurs de plates-formes ont les moyens d’y parvenir.
P
our les applications qui ont
besoin d’un traitement gra-
phique ingré de perfor-
mance élevée, il faut,
au-delà de la puissance d’affichage
requise, réussir à mettre en œuvre
des systèmes de capture d’images
extrêmement rapides et des fonc-
tions de traitement d’image optimi-
sées. Les données des capteurs
doivent, en sus, être traitées de
manière à générer des images pour
une consommation d’énergie la plus
faible possible et, idéalement, en
temps réel. Ce qui nécessite de la
puissance de calcul en termes de
traitement parallèle. Les solutions
existantes basées sur des DSP ou des
FPGA sont adaptées à ce
type d’application, car ces
architectures sont puis-
santes. Mais elles ont un
caractère propriétaire et,
souvent, réclament des
développements supp-
mentaires, ce qui entraîne
des coûts élevés et des
efforts de conception
importants.
La solution idéale pour les
applications graphiques
intégrées est de combiner
toutes ces exigences
requises au sein d’un seul
système à la fois compact
et économe en énergie.
Avec, à la clé, une puissance de
calcul suffisante associée à une
parallélisation intensive des traite-
ments, un affichage en temps réel
des images et une haute perfor-
mance graphique pour la visualisa-
tion, le tout sur une plate-forme
matérielle réutilisable.
C’est l’objectif affiché par une archi-
tecture système hétérogène basée sur
une carte COM (Computer On
Module) architecturée autour des
unités de traitement accéléré (APU)
de la famille de processeurs R-Series
d’AMD. Sur une puce de silicium,
ces systèmes intègrent un processeur
x86 multicœur, conçu pour gérer
efficacement les tâches d’un PC clas-
sique, associé à une unité vectorielle
programmable pour des
tâches de calcul parallèle et d’info-
graphie de haute performance. Dans
cette approche, grâce à l’intégration
étroite des unités de traitement spé-
cialisées avec des groupes auxiliaires
très compacts, l’ensemble est éco-
nome en énergie et est capable de
soutenir des charges de travail évo-
lutives.
Une unité de calcul
faite pour paralléliser
les traitements
Dans la pratique, quelle unité de
calcul est responsable des tâches
parallèles ? La réponse est simple :
c’est le processeur graphique intégré.
En effet, sous l’effet des développe-
ments dans le secteur des applica-
tions grand public, en particulier des
jeux, les unités graphiques ont évo-
lué pour que les déve-
loppeurs, qui le récla-
maient, puissent exploiter
leur capacité à traiter les
données en parallèle. De
fait, les GPU (Graphical
Processor Unit) se sont
transformées au fil des ans.
Aujourd’hui, elles sont
composées de plusieurs
centaines d’unités élémen-
taires de traitement
capables d’effectuer des
calculs complexes en
parallèle. Et comme ces
architectures peuvent le
faire avec des données
générées à partir d’un jeu
d’ordinateur, tout naturelle-
ment, les développeurs se
sont rendus compte quelles
pouvaient faire de même
avec des données réelles
issue de capteurs.
AUTEUR
La structure de la puce
du processeur
Embedded R-Series
d’AMD, qui intègre des
ressources partagées
et dédiées, apporte des
performances de calcul
élevées pour une faible
consommation d’énergie.
L’EMBARQUÉ / N°4 / 2013 35
Médical Application
Pour parvenir à cette ouverture en
termes de programmation, l’unité
intégrée Radeon de la famille 7000
d’AMD, côté matériel, dispose de
128 à 384 cœurs graphiques avec
une vitesse d’horloge jusqu’à
686 MHz. Avec un résultat de 13 066
lors du test 3DMark Vantage « E »,
l’APU R-464L d’AMD fait ainsi partie
des unités graphiques intégrées les
plus puissantes sur le marché. Et,
pour les tâches de calcul parallèle,
cette unité de calcul atteint en per-
formance de calcul en simple préci-
sion jusqu’à 576 Gflops (Giga Floa-
ting Operations Per Second).
L’OpenCL ouvre la voie à
la programmation parallèle
Coté logiciel, pour permettre aux
développeurs de tirer le meilleur parti
de cette puissance de traitement
parallèle, le module conga-TFS COM
de congatec, architecturé autour d’un
APU Embedded R-Series supporte,
via une API ad hoc, le langage
OpenCL. Rappelons que ce dernier
est un environnement de program-
mation qui permet aux tâches infor-
matiques d’être distribuées et traitées
sur des systèmes de processeurs hété-
rogènes. L’OpenCL offre la particula-
rité de pouvoir programmer l’exécu-
tion parallèle et multiple d’une
application en la découpant en
étapes unitaires de calcul (SIMD :
Single Instruction Multiple Data), ce
qui signifie que les architectures spé-
cifiquement dédiées au calcul paral-
lèle classique sont aussi supportées
par cette approche. Conséquence,
au-delà des travaux de programma-
tion pour l’affichage graphique, de
nombreux problèmes analytiques
peuvent être traités par le biais de
l’OpenCL. Ainsi, en mettant en
œuvre des calculs parallèles com-
plexes réclamant de la précision,
quelques étapes de traitement suf-
fisent à résoudre le problème alors
qu’avec un processeur classique, il
faudrait plusieurs milliers d’étapes
pour arriver au même résultat. Consé-
quence, les temps de calcul et la
consommation d’énergie pour les
tâches de calcul complexes dimi-
nuent de manière drastique.
Les applications d’imagerie médi-
cale, qui souvent se prêtent bien à la
parallèlisation des calculs (répétitions
de calculs identiques, algorithmes de
traitement séquentiel via des FFT…),
sont des candidates idéales pour ce
type d’approche. Par exemple, les
enregistrements d’images répétées,
comme dans un scanner, demandent
non seulement de la puissance de
calcul, mais aussi une parallélisation
intense de ces calculs afin que
l’image soit parfaitement stable à
l’écran. Ici, l’utilisation de l’OpenCL
sur une architecture hétérogène per-
met d’envisager des gains en vitesse
d’exécution de 120 à 130 par rapport
à une approche plus classique sur un
processeur x86.
Lorsque ces processeurs sont intégrés
sur un module COM, l’ensemble per-
met aux développeurs et aux équipe-
mentiers de concevoir des dispositifs
médicaux, avec leurs applications, de
manière sécurisée. En effet, ces
modules COM constituent le cœur
des fonctions informatiques d’un sys-
tème. On peut les considérer comme
des composants pré-intégrés connec-
tés sur une carte porteuse sur laquelle
sont installés les interfaces externes
et les périphériques nécessaires à
l’application. Cette séparation de la
carte porteuse de l’unité de calcul est
un avantage certain pour le domaine
du médical, car ces équipements
doivent répondre à de nombreuses
caractéristiques, comme par exemple
la norme EN6061, qui spécifie la
valeur des courants de fuite à travers
les entrées/sorties qui doivent être
extrêmement faibles. Dans ce cas,
cette exigence nécessite une exper-
tise forte au niveau de la conception
des entrées/sorties, qui se trouvent sur
la carte porteuse, sans que l’équipe
de design n’ait à se préoccuper de
l’unité centrale qui sera mise en
place. n
UN MODULE FAIT POUR LE GRAPHIQUE…
n Le cœur graphique intégré
sur la carte COM Express de
Congatec est compatible avec
les standards DirectX11 et Open-
GL 4.2 pour l’imagerie rapide en
2D et 3D. Une unitéde traitement
vidéo (Universal Video Decoder)
permet le traitement des ux vidéo
H.264, VC-1, Mpeg-4 Part 2 et
Mpeg-2. Les interfaces graphiques
présentes offrent le choix entre le
VGA et le LVDS 18/24 bits simple
ou double canal, trois interfaces
DisplayPort 1.2, un port HDMI 1.4
et deux liens DVI Single Link pour
un contrôle direct de trois écrans
indépendants. Sept voies PCI
Express 2.0 x1, un PCI Express
2.0 x8, quatre ports SuperSpeed
USB 3.0, quatre ports USB 2.0,
quatre ports Sata 6 Gbit/s, une in-
terface Gigabit Ethernet et un port
audio haute dénition complètent
l'ensemble.
L’architecture de l’APU R-Series d’AMD intègre
dans une solution à deux puces tous les principaux
éléments d’un système processeur, y compris les cœurs
x86, les moteurs GPU vectoriels (SIMD) et le décodeur
vidéo unifié.
Le module processeur COM
conga-TFS, avec son processeur
Embedded R-Series d’AMD,
est adapté aux contraintes des
applications d’imagerie médicale
grâce aux possibilités offertes par
cette architecture pour paralléliser
des opérations de calcul. Ce
module prend en charge trois
versions du processeur Embedded
R-Series s’échelonnant de l’AMD
R-272F double cœur à l’AMD
R-464L à quadruple cœur, associés
au contrôleur hub A70M d’AMD,
avec, à disposition, jusqu’à 16 Go
de mémoire DDR3 double canal
à 1 600 MHz.
Logiciels & systèmes
Professionnels de l’embarqué
Découvrez le système d’information
le plus complet, 100% utile à votre métier !
Une newsletter quotidienne
Votre fi l d’actualité gratuit
Une newsletter hebdo
Tous les jeudis,
des infos exclusives à forte
valeur ajoutée
Un magazine
100% numérique, trimestriel,
pour une information fouillée,
analysée et développée
Un site Internet
Plus de 1 500 articles par an
exclusivement dédiés à l’embarqué
Abonnez-vous www.lembarque.com
•Pub 148x210.indd 1 20/03/13 12:52
1 / 3 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !