L’EMBARQUÉ / N°4 / 2013 35
Médical Application
Pour parvenir à cette ouverture en
termes de programmation, l’unité
intégrée Radeon de la famille 7000
d’AMD, côté matériel, dispose de
128 à 384 cœurs graphiques avec
une vitesse d’horloge jusqu’à
686 MHz. Avec un résultat de 13 066
lors du test 3DMark Vantage « E »,
l’APU R-464L d’AMD fait ainsi partie
des unités graphiques intégrées les
plus puissantes sur le marché. Et,
pour les tâches de calcul parallèle,
cette unité de calcul atteint en per-
formance de calcul en simple préci-
sion jusqu’à 576 Gflops (Giga Floa-
ting Operations Per Second).
L’OpenCL ouvre la voie à
la programmation parallèle
Coté logiciel, pour permettre aux
développeurs de tirer le meilleur parti
de cette puissance de traitement
parallèle, le module conga-TFS COM
de congatec, architecturé autour d’un
APU Embedded R-Series supporte,
via une API ad hoc, le langage
OpenCL. Rappelons que ce dernier
est un environnement de program-
mation qui permet aux tâches infor-
matiques d’être distribuées et traitées
sur des systèmes de processeurs hété-
rogènes. L’OpenCL offre la particula-
rité de pouvoir programmer l’exécu-
tion parallèle et multiple d’une
application en la découpant en
étapes unitaires de calcul (SIMD :
Single Instruction Multiple Data), ce
qui signifie que les architectures spé-
cifiquement dédiées au calcul paral-
lèle classique sont aussi supportées
par cette approche. Conséquence,
au-delà des travaux de programma-
tion pour l’affichage graphique, de
nombreux problèmes analytiques
peuvent être traités par le biais de
l’OpenCL. Ainsi, en mettant en
œuvre des calculs parallèles com-
plexes réclamant de la précision,
quelques étapes de traitement suf-
fisent à résoudre le problème alors
qu’avec un processeur classique, il
faudrait plusieurs milliers d’étapes
pour arriver au même résultat. Consé-
quence, les temps de calcul et la
consommation d’énergie pour les
tâches de calcul complexes dimi-
nuent de manière drastique.
Les applications d’imagerie médi-
cale, qui souvent se prêtent bien à la
parallèlisation des calculs (répétitions
de calculs identiques, algorithmes de
traitement séquentiel via des FFT…),
sont des candidates idéales pour ce
type d’approche. Par exemple, les
enregistrements d’images répétées,
comme dans un scanner, demandent
non seulement de la puissance de
calcul, mais aussi une parallélisation
intense de ces calculs afin que
l’image soit parfaitement stable à
l’écran. Ici, l’utilisation de l’OpenCL
sur une architecture hétérogène per-
met d’envisager des gains en vitesse
d’exécution de 120 à 130 par rapport
à une approche plus classique sur un
processeur x86.
Lorsque ces processeurs sont intégrés
sur un module COM, l’ensemble per-
met aux développeurs et aux équipe-
mentiers de concevoir des dispositifs
médicaux, avec leurs applications, de
manière sécurisée. En effet, ces
modules COM constituent le cœur
des fonctions informatiques d’un sys-
tème. On peut les considérer comme
des composants pré-intégrés connec-
tés sur une carte porteuse sur laquelle
sont installés les interfaces externes
et les périphériques nécessaires à
l’application. Cette séparation de la
carte porteuse de l’unité de calcul est
un avantage certain pour le domaine
du médical, car ces équipements
doivent répondre à de nombreuses
caractéristiques, comme par exemple
la norme EN6061, qui spécifie la
valeur des courants de fuite à travers
les entrées/sorties qui doivent être
extrêmement faibles. Dans ce cas,
cette exigence nécessite une exper-
tise forte au niveau de la conception
des entrées/sorties, qui se trouvent sur
la carte porteuse, sans que l’équipe
de design n’ait à se préoccuper de
l’unité centrale qui sera mise en
place. n
UN MODULE FAIT POUR LE GRAPHIQUE…
n Le cœur graphique intégré
sur la carte COM Express de
Congatec est compatible avec
les standards DirectX11 et Open-
GL 4.2 pour l’imagerie rapide en
2D et 3D. Une unitéde traitement
vidéo (Universal Video Decoder)
permet le traitement des ux vidéo
H.264, VC-1, Mpeg-4 Part 2 et
Mpeg-2. Les interfaces graphiques
présentes offrent le choix entre le
VGA et le LVDS 18/24 bits simple
ou double canal, trois interfaces
DisplayPort 1.2, un port HDMI 1.4
et deux liens DVI Single Link pour
un contrôle direct de trois écrans
indépendants. Sept voies PCI
Express 2.0 x1, un PCI Express
2.0 x8, quatre ports SuperSpeed
USB 3.0, quatre ports USB 2.0,
quatre ports Sata 6 Gbit/s, une in-
terface Gigabit Ethernet et un port
audio haute dénition complètent
l'ensemble.
● L’architecture de l’APU R-Series d’AMD intègre
dans une solution à deux puces tous les principaux
éléments d’un système processeur, y compris les cœurs
x86, les moteurs GPU vectoriels (SIMD) et le décodeur
vidéo unifié.
● Le module processeur COM
conga-TFS, avec son processeur
Embedded R-Series d’AMD,
est adapté aux contraintes des
applications d’imagerie médicale
grâce aux possibilités offertes par
cette architecture pour paralléliser
des opérations de calcul. Ce
module prend en charge trois
versions du processeur Embedded
R-Series s’échelonnant de l’AMD
R-272F double cœur à l’AMD
R-464L à quadruple cœur, associés
au contrôleur hub A70M d’AMD,
avec, à disposition, jusqu’à 16 Go
de mémoire DDR3 double canal
à 1 600 MHz.