Distributions Hadoop prises en charge par Big Data Management
Dans la version 10.1.1, les modifications suivantes s'appliquent à la prise en charge des distributions
Hadoop par Big Data Management :
Distributions Hadoop prises en charge
À la date de sortie, la version 10.1.1 prend en charge les distributions Hadoop suivantes :
•Azure HDInsight v. 3.4
•Cloudera CDH v. 5.8
•IBM BigInsights v. 4.2
•Hortonworks HDP v. 2.5
•Amazon EMR v. 5.0
Il se peut que les versions futures de Big Data Management prennent en charge une ou plusieurs de ces
distributions Hadoop. Pour consulter une liste des dernières versions prises en charge, consultez la
matrice de disponibilité des produits sur le portail des clients Informatica :
https://
network.informatica.com/community/informatica-network/product-availability-matrices
Prise en charge MapR
Dans la version 10.1.1, Informatica a reporté la prise en charge de Big Data Management sur une
grappe MapR. Pour exécuter des mappages sur une grappe MapR, utilisez Big Data Management 10.1.
Informatica prévoit de rétablir la prise en charge dans une prochaine version.
Certaines références à MapR sont conservées dans la documentation sous la forme d'exemples.
Appliquez la structure de ces exemples à votre distribution Hadoop.
Prise en charge Amazon EMR
Dans la version 10.1.1, vous pouvez installer Big Data Management dans l'environnement Amazon
EMR. Vous pouvez choisir parmi les méthodes d'installation suivantes :
•Télécharger et installer depuis un package RPM Lorsque vous installez Big Data Management dans
un environnement Amazon EMR, vous installez des éléments Big Data Management sur une machine
locale pour exécuter le service de référentiel modèle, le service d'intégration de données et d'autres
services.
•Installer une instance Informatica dans un environnement nuage Amazon. Lorsque vous créez une
implémentation de Big Data Management dans le nuage Amazon, vous apportez des machines
virtuelles en ligne à l'endroit où vous installez et exécutez Big Data Management.
Pour plus d'informations sur l'installation et la configuration de Big Data Management sur Amazon EMR,
consultez le Guide d'installation et de configuration d'Informatica Big Data Management 10.1.1.
Prise en charge de Big Data Management de Spark
À partir de la version 10.1.1, vous pouvez configurer le moteur Spark sur toutes les distributions Hadoop
prises en charge. Vous pouvez configurer Big Data Management de façon à utiliser l'une des versions
Spark suivantes en fonction de la distribution Hadoop utilisée :
•Cloudera Spark 1.6 et Apache Spark 2.0.1 pour la distribution de Cloudera cdh5u8.
•Apache Spark 2.0.1 pour toutes les distributions Hadoop.
2017-01-20 3