Ce billet montre comment implémenter un cluster Spark – que ce soit via Azure Management Portal ou Azure Powershell – et y manipuler des données dans un environnement HDInsight avec Scala ou le SQL.
Archives de Tag: HDInsight
[Big Data] Spark: concepts généraux
Ce billet présente Apache Spark.
[Big Data] HDInsight : implémentation et utilisation d’un cluster Storm
Ce billet montre comment implémenter un cluster Storm – que ce soit via Azure Management Portal ou Azure Powershell – et y manipuler des données dans un environnement HDInsight.
[Big Data] Storm : concepts généraux
Ce billet présente Apache Storm et ses concepts associés.
[Big Data] HDInsight : implémentation et utilisation d’un cluster HBase, et mapping avec Hive
Ce billet montre comment implémenter un cluster HBase – que ce soit via Azure Management Portal ou Azure Powershell – et y manipuler des données dans un environnement HDInsight.
[Big Data] HDInsight : utilisation de Pig sur un cluster Hadoop
Ce billet montre comment charger et manipuler des données dans une table Pig, au sein d’un cluster Hadoop HDInsight. La démonstration sera présentée sous 2 contextes principaux : localement (i.e., là où se trouve le cluster), via Hadoop Command Line et à distance (i.e., sur une machine personnelle), avec Azure Powershell.
[Big Data] HDInsight : utilisation de Hive sur un cluster Hadoop
Ce billet montre comment charger et manipuler des données dans une table Hive, au sein d’un cluster Hadoop HDInsight. La démonstration sera présentée sous 2 contextes principaux : localement (i.e., là où se trouve le cluster), via Hadoop Command Line et à distance (i.e., sur une machine personnelle), avec Azure Powershell. Des tests via l’Azure Management Portal seront également effectués afin d’enrichir la démonstration pratique de l’utilisation de Hive.
[Big Data] HDInsight : upload de données vers Hadoop avec Azure Storage Explorer, Azure Powershell ou Sqoop
Ce billet fournit quelques exemples pratiques d’upload de données vers Hadoop HDInsight.