CAHIER DES CLAUSES TECHNIQUES PUMA 48504 L’Institut Pierre-Simon Laplace développe actuellement un certain nombre de «services climatiques». A partir de sorties de modèles climatiques développées à l'IPSL et dans d'autres centres de recherche publique sur le climat, ces services sont destinés à fournir des données professionnelles pour l'adaptation au changement climatique dans divers secteurs économiques. Les sorties des modèles climatiques ne sont généralement pas adaptées pour une application professionnelle directe et ont besoin de post-traitement (projection sur une grille géographique commune, traitement des biais, estimation de l’incertitude, contrôle qualité), nécessitant un traitement systématisé et une chaîne assurant un contrôle qualité des données. L’IPSL a développé un certain nombre de techniques et d’algorithmes permettant ces traitements, et leur application nécessite maintenant une production automatisée. Le besoin porte sur la production d’une base de données de simulations climatiques posttraitées avec un contrôle qualité assuré et l’ensemble des procédures entièrement documentées. Les données post-traitées devront être génériques et s’adresseront à un marché de sociétés professionnelles et consultants spécialistes souhaitant développer des produits dédiés pour leurs clients. L’IPSL fournira au prestataire les simulations climatiques projetées sur une grille commune. Il fournira au prestataire des exemples de post-traitements (de type traitement des biais et estimation de l'incertitude) pour un petit nombre de variables climatiques (température et précipitation) sous forme de codes numériques d’exemple, des jeux de données d’observations, afin que le prestataire puisse généraliser l’application des méthodes statistiques développées à l’IPSL ou similaires à un ensemble plus large de variables climatiques. Le prestataire devra ainsi adapter les exemples fournis par l'IPSL à un plus grand nombre de variables climatiques. L’IPSL fournira également au prestataire l’environnement logiciel permettant l'automatisation et le chainage des traitements (le logiciel , open source est documenté ici: http://prodiguerdocs.readthedocs.org/en/latest/analysis.html; http://github.com/Prodiguer/synda/). Le prestataire intègrera dans cet environnement logiciel les nouveaux post-traitements. Les données et la chaîne de traitement seront disponibles sur l'infrastructure matérielle de l'IPSL. Le prestataire utilisera l'infrastructure matérielle de l'IPSL, ce qui pourra nécessiter l’intervention du personnel du prestataire dans les locaux de l’IPSL Place Jussieu Paris 5°. Cette infrastructure se compose pour l'essentiel d'un cluster de calcul (400 cœurs) connecté à haut débit à des espaces de stockage (1Po de donnée). L'infrastructure dispose des logiciels et des données brutes nécessaires à l'exécution des post-traitements faisant l'objet de cette appel d'offre. Le prestataire livrera, à partir de ces éléments une base de données de simulations post-traitées ayant les caractéristiques suivantes : couvrant l’échelle globale et l’échelle européenne couvrant plusieurs scénarios d’émissions de gaz à effet de serre 1 distribution statistique des simulations post-traitées sans biais, similaire à celle d’observations pour une période de référence passée validation des données par un ensemble de tests couvrant au minimum les variables climatiques suivantes (l’offre pourra proposer d’autres variables): o température moyenne journalière o température minimale journalière o température maximale journalière o cumul journalier de précipitations o vent en surface o rayonnement solaire en surface plusieurs formats des données, adaptés à la recherche sur le climat, les impacts du changement climatique, et aux utilisations professionnelles l’application d’une procédure de contrôle de qualité, dont les étapes seront décrites Le prestataire livrera l’ensemble de la documentation permettant aux équipes de l’IPSL de reproduire les traitements (en particulier le traitement des biais et le contrôle qualité), et de les appliquer à d’autres jeux de simulations climatiques. L'intégration de ces traitements dans la chaîne de traitement automatisé géré par le logiciel synda devra se faire en respectant les bonnes pratiques définies par les équipes de développement de synda et consultables à l'adresse suivante : http://prodiguerdocs.readthedocs.org PLANNING DE LA PRESTATION L’offre proposera un planning avec une phase de test (prise en main et optimisation des logiciels de traitement des biais) nécessitant plusieurs échanges avec les équipes de l’IPSL et réunions, afin de définir l’ensemble des aspects algorithmiques et techniques une phase de production, plusieurs échanges de jeux de données pour validation. La livraison des données devant être effectuée à 12 mois une phase de test et de qualification des données produites une phase de formation à l’utilisation de la base de données sur site Les livrables attendus sont : généralisation des codes numériques d'exemples fournis par l'IPSL inclusion des traitements numériques additionnels dans la chaîne de production synda une base de données selon les caractéristiques attendues définies ci-dessus une documentation complète des algorithmes, méthodes de vérification et de contrôle de qualité 2