[Big Data] Hortonworks : installation et configuration de HDP 2.x avec Ambari

Ce billet présente comment installer et configurer un cluster HDP 2.x avec Ambari.

Lire la suite

Publicités

[Big Data] Hortonworks : utilisation d’un cluster Spark avec HDP 2.x

Ce billet montre comment lancer et utiliser un cluster Spark sur HDP, la plateforme Hadoop de Hortonworks. Des tests seront également effectués via le shell de Spark, dans l’interface Scala (RDD, Hive, ORC, SQL avec Thrift…).

Lire la suite

[Big Data] Hortonworks : importation de données dans Hadoop avec HDP 2.x via Sqoop et analyse avec Hive

Ce billet montre comment importer des données issues d’une base de données avec Apache Sqoop dans un cluster Hadoop avec HDP, via la Sandbox de Hortonworks. Hive sera utilisé dans notre démonstration pour le stockage et l’analyse sous Hue.

SQL Server sera utilisée comme base de données source pour la démonstration.

Lire la suite

[Big Data] Hadoop/HDInsight : overview

This article addresses Big Data, with a focus on HDInsight, the Hadoop distribution from Microsoft and Hortonworks.

Lire la suite

[Big Data] Hadoop/HDInsight : concepts généraux

Ce billet aborde les Big Data, avec un focus sur HDInsight, la distribution Hadoop de Microsoft.

Lire la suite