[Big Data] Hortonworks : utilisation d’un cluster Spark avec HDP 2.x

Ce billet montre comment lancer et utiliser un cluster Spark sur HDP, la plateforme Hadoop de Hortonworks. Des tests seront également effectués via le shell de Spark, dans l’interface Scala (RDD, Hive, ORC, SQL avec Thrift…).

Lire la suite

[Big Data] Hortonworks : importation de données dans Hadoop avec HDP 2.x via Sqoop et analyse avec Hive

Ce billet montre comment importer des données issues d’une base de données avec Apache Sqoop dans un cluster Hadoop avec HDP, via la Sandbox de Hortonworks. Hive sera utilisé dans notre démonstration pour le stockage et l’analyse sous Hue.

SQL Server sera utilisée comme base de données source pour la démonstration.

Lire la suite