Ce billet présente comment installer et configurer un cluster HDP 2.x avec Ambari.
Archives de Tag: Hive
[Big Data] Hortonworks : utilisation d’un cluster Spark avec HDP 2.x
Ce billet montre comment lancer et utiliser un cluster Spark sur HDP, la plateforme Hadoop de Hortonworks. Des tests seront également effectués via le shell de Spark, dans l’interface Scala (RDD, Hive, ORC, SQL avec Thrift…).
[Big Data] Hortonworks : importation de données dans Hadoop avec HDP 2.x via Sqoop et analyse avec Hive
Ce billet montre comment importer des données issues d’une base de données avec Apache Sqoop dans un cluster Hadoop avec HDP, via la Sandbox de Hortonworks. Hive sera utilisé dans notre démonstration pour le stockage et l’analyse sous Hue.
SQL Server sera utilisée comme base de données source pour la démonstration.
[Big Data] Hortonworks : introduction à HDP et à Ambari
Ce billet présente HDP 2.x, la distribution Hadoop de Hortonworks, et comment l’installer et configurer via la Sandbox. Il aborde également Ambari.
[Big Data] HDInsight : implémentation et utilisation d’un cluster Spark
Ce billet montre comment implémenter un cluster Spark – que ce soit via Azure Management Portal ou Azure Powershell – et y manipuler des données dans un environnement HDInsight avec Scala ou le SQL.
[Big Data] HDInsight : implémentation et utilisation d’un cluster HBase, et mapping avec Hive
Ce billet montre comment implémenter un cluster HBase – que ce soit via Azure Management Portal ou Azure Powershell – et y manipuler des données dans un environnement HDInsight.
[Big Data] HDInsight : utilisation de Hive sur un cluster Hadoop
Ce billet montre comment charger et manipuler des données dans une table Hive, au sein d’un cluster Hadoop HDInsight. La démonstration sera présentée sous 2 contextes principaux : localement (i.e., là où se trouve le cluster), via Hadoop Command Line et à distance (i.e., sur une machine personnelle), avec Azure Powershell. Des tests via l’Azure Management Portal seront également effectués afin d’enrichir la démonstration pratique de l’utilisation de Hive.
[Big Data] Hadoop/HDInsight : overview
This article addresses Big Data, with a focus on HDInsight, the Hadoop distribution from Microsoft and Hortonworks.
[Big Data] Hadoop/HDInsight : concepts généraux
Ce billet aborde les Big Data, avec un focus sur HDInsight, la distribution Hadoop de Microsoft.