[Big Data] Hortonworks : utilisation d’un cluster Spark avec HDP 2.x

Ce billet montre comment lancer et utiliser un cluster Spark sur HDP, la plateforme Hadoop de Hortonworks. Des tests seront également effectués via le shell de Spark, dans l’interface Scala (RDD, Hive, ORC, SQL avec Thrift…).

Lire la suite

Publicités

[Big Data] HDInsight : implémentation et utilisation d’un cluster Spark

Ce billet montre comment implémenter un cluster Spark – que ce soit via Azure Management Portal ou Azure Powershell – et y manipuler des données dans un environnement HDInsight avec Scala ou le SQL.

Lire la suite