CAHIER DES CLAUSES TECHNIQUES PUMA 48504 L`Institut

publicité
CAHIER DES CLAUSES TECHNIQUES
PUMA 48504
L’Institut Pierre-Simon Laplace développe actuellement un certain nombre de «services
climatiques». A partir de sorties de modèles climatiques développées à l'IPSL et dans d'autres
centres de recherche publique sur le climat, ces services sont destinés à fournir des données
professionnelles pour l'adaptation au changement climatique dans divers secteurs économiques.
Les sorties des modèles climatiques ne sont généralement pas adaptées pour une application
professionnelle directe et ont besoin de post-traitement (projection sur une grille géographique
commune, traitement des biais, estimation de l’incertitude, contrôle qualité), nécessitant un
traitement systématisé et une chaîne assurant un contrôle qualité des données. L’IPSL a
développé un certain nombre de techniques et d’algorithmes permettant ces traitements, et leur
application nécessite maintenant une production automatisée.
Le besoin porte sur la production d’une base de données de simulations climatiques posttraitées avec un contrôle qualité assuré et l’ensemble des procédures entièrement documentées.
Les données post-traitées devront être génériques et s’adresseront à un marché de sociétés
professionnelles et consultants spécialistes souhaitant développer des produits dédiés pour
leurs clients.
L’IPSL fournira au prestataire les simulations climatiques projetées sur une grille commune. Il
fournira au prestataire des exemples de post-traitements (de type traitement des biais et
estimation de l'incertitude) pour un petit nombre de variables climatiques (température et
précipitation) sous forme de codes numériques d’exemple, des jeux de données d’observations,
afin que le prestataire puisse généraliser l’application des méthodes statistiques développées à
l’IPSL ou similaires à un ensemble plus large de variables climatiques. Le prestataire devra ainsi
adapter les exemples fournis par l'IPSL à un plus grand nombre de variables climatiques.
L’IPSL fournira également au prestataire l’environnement logiciel permettant l'automatisation et
le chainage des traitements (le logiciel , open source est documenté ici: http://prodiguerdocs.readthedocs.org/en/latest/analysis.html; http://github.com/Prodiguer/synda/). Le
prestataire intègrera dans cet environnement logiciel les nouveaux post-traitements.
Les données et la chaîne de traitement seront disponibles sur l'infrastructure matérielle de
l'IPSL. Le prestataire utilisera l'infrastructure matérielle de l'IPSL, ce qui pourra nécessiter
l’intervention du personnel du prestataire dans les locaux de l’IPSL Place Jussieu Paris 5°. Cette
infrastructure se compose pour l'essentiel d'un cluster de calcul (400 cœurs) connecté à haut
débit à des espaces de stockage (1Po de donnée). L'infrastructure dispose des logiciels et des
données brutes nécessaires à l'exécution des post-traitements faisant l'objet de cette appel
d'offre.
Le prestataire livrera, à partir de ces éléments une base de données de simulations post-traitées
ayant les caractéristiques suivantes :


couvrant l’échelle globale et l’échelle européenne
couvrant plusieurs scénarios d’émissions de gaz à effet de serre
1





distribution statistique des simulations post-traitées sans biais, similaire à celle
d’observations pour une période de référence passée
validation des données par un ensemble de tests
couvrant au minimum les variables climatiques suivantes (l’offre pourra proposer
d’autres variables):
o température moyenne journalière
o température minimale journalière
o température maximale journalière
o cumul journalier de précipitations
o vent en surface
o rayonnement solaire en surface
plusieurs formats des données, adaptés à la recherche sur le climat, les impacts du
changement climatique, et aux utilisations professionnelles
l’application d’une procédure de contrôle de qualité, dont les étapes seront décrites
Le prestataire livrera l’ensemble de la documentation permettant aux équipes de l’IPSL de
reproduire les traitements (en particulier le traitement des biais et le contrôle qualité), et de les
appliquer à d’autres jeux de simulations climatiques.
L'intégration de ces traitements dans la chaîne de traitement automatisé géré par le logiciel
synda devra se faire en respectant les bonnes pratiques définies par les équipes de
développement de synda et consultables à l'adresse suivante : http://prodiguerdocs.readthedocs.org
PLANNING DE LA PRESTATION
L’offre proposera un planning avec




une phase de test (prise en main et optimisation des logiciels de traitement des biais)
nécessitant plusieurs échanges avec les équipes de l’IPSL et réunions, afin de définir
l’ensemble des aspects algorithmiques et techniques
une phase de production, plusieurs échanges de jeux de données pour validation. La
livraison des données devant être effectuée à 12 mois
une phase de test et de qualification des données produites
une phase de formation à l’utilisation de la base de données sur site
Les livrables attendus sont :




généralisation des codes numériques d'exemples fournis par l'IPSL
inclusion des traitements numériques additionnels dans la chaîne de production synda
une base de données selon les caractéristiques attendues définies ci-dessus
une documentation complète des algorithmes, méthodes de vérification et de contrôle de
qualité
2
Téléchargement