Ce billet présente comment construire un flux de tweets avec la plateforme HDF (Hortonworks Data Flow) via NiFi.
Archives de Catégorie: Hadoop
[Internet of Things] Hortonworks : installation, configuration et utilisation de NiFi avec HDF
Ce billet présente comment installer et configurer la plateforme HDF (Hortonworks Data Flow) pour utiliser NiFi.
[Big Data] Hortonworks : installation et configuration de HDP 2.x avec Ambari
Ce billet présente comment installer et configurer un cluster HDP 2.x avec Ambari.
[Big Data] Hortonworks : utilisation d’un cluster Spark avec HDP 2.x
Ce billet montre comment lancer et utiliser un cluster Spark sur HDP, la plateforme Hadoop de Hortonworks. Des tests seront également effectués via le shell de Spark, dans l’interface Scala (RDD, Hive, ORC, SQL avec Thrift…).
[Big Data] Hortonworks : utilisation d’un cluster Storm pour le streaming de données avec HDP 2.x
Ce billet montre comment lancer et utiliser un cluster Storm sur HDP, la plateforme Hadoop de Hortonworks.
[Big Data] Hortonworks : importation de données dans Hadoop avec HDP 2.x via Sqoop et analyse avec Hive
Ce billet montre comment importer des données issues d’une base de données avec Apache Sqoop dans un cluster Hadoop avec HDP, via la Sandbox de Hortonworks. Hive sera utilisé dans notre démonstration pour le stockage et l’analyse sous Hue.
SQL Server sera utilisée comme base de données source pour la démonstration.
[Big Data] Hortonworks : introduction à HDP et à Ambari
Ce billet présente HDP 2.x, la distribution Hadoop de Hortonworks, et comment l’installer et configurer via la Sandbox. Il aborde également Ambari.
[Big Data] HDInsight : implémentation et utilisation d’un cluster Spark
Ce billet montre comment implémenter un cluster Spark – que ce soit via Azure Management Portal ou Azure Powershell – et y manipuler des données dans un environnement HDInsight avec Scala ou le SQL.
[Big Data] HDInsight : implémentation et utilisation d’un cluster HBase, et mapping avec Hive
Ce billet montre comment implémenter un cluster HBase – que ce soit via Azure Management Portal ou Azure Powershell – et y manipuler des données dans un environnement HDInsight.