Sélection d’un modèle de déploiement pour les systèmes d’analyse de Big Data

Les systèmes d’analyse de Big Data sont généralement déployés à l’aide des deux modèles de déploiement suivants :

Le choix d’un modèle de déploiement approprié dépend principalement de la source des données utilisées par l’analyse de Big Data.

Le modèle de déploiement Apache Spark utilise ArcGIS sous la forme de bibliothèques Apache Spark pour effectuer des analyses sur des données persistantes à partir d’emplacements centralisés (par exemple, lacs de données [ou data lakes], stockage d’objets, bases de données relationnelles, fichiers) accessibles à l’environnement Apache Spark. Le modèle de déploiement Apache Spark est le modèle le plus courant pour les spécialistes des données effectuant des analyses spatiales de Big Data. Le modèle de déploiement Apache Spark a pour fondement d’apporter l’analyse spatiale à l’environnement que le spécialiste des données connaît. Pour ce faire, l’utilisation d’une bibliothèque Spark permet aux spécialistes des données d’ajouter des fonctions et des processus spatiaux à des flux de travail analytiques nouveaux ou existants. Apache Spark fournit des fonctionnalités de calcul distribuées qui prennent en charge l’accès à un large éventail de jeux de données, un ensemble de fonctionnalités de bibliothèque robuste, la possibilité d’explorer et d’interagir avec des analyses structurées et la capacité de produire des résultats utilisables par une partie prenante ou un processus métier en aval. 

L’analyse Big Data peut également être effectuée dans le cadre du modèle de déploiement SaaS pour la diffusion en continu et l’analyse de données en temps réel. Dans ce modèle, les données de capteurs ou d’événements en temps réel sont ingérées dans l’offre SaaS, analysées en temps réel ou archivées pour une utilisation ultérieure par un processus d’analyse Big Data défini par l’utilisateur. 

Il existe de nombreuses différences fonctionnelles et non fonctionnelles entre les modèles de déploiement Apache Spark et SaaS, telles que l’interface de conception des modèles d’analyse et les outils et fonctionnalités analytiques spécifiques fournis. Cependant, outre la préférence organisationnelle sur les modèles de déploiement, le point de décision clé tend à être de savoir si le système d’analyse Big Data sera principalement utilisé pour analyser des données et des observations en temps réel ou si le système sera utilisé pour analyser les données persistantes dans les Big Data stores existants au sein de l’organisation (par exemple, les lacs de données). Pour plus d’informations, consultez les pages sur les modèles de déploiement Apache Spark et SaaS.

Pour obtenir des informations générales et des considérations relatives à ces approches de déploiement, reportez-vous à la page Produits ArcGIS et options de déploiement de la vue d’ensemble d’ArcGIS.

Top