Environnements Spark avec ArcGIS GeoAnalytics Engine

De nombreuses organisations utilisent un système de données unifié ou une plateforme d’analyse convergée pour gérer et utiliser les ressources de données d’entreprise. Cette tendance à la consolidation a introduit un modèle de déploiement et d’architecture axé sur les ressources de calcul situées à proximité des sources de données, souvent accessibles via un environnement d’ingénierie et d’analyse des données développé avec Apache Spark. À l’instar du modèle de système d’analyse Big Data, les résultats d’analyse spatiale et temporelle de Big Data sont généralement réécrits dans des data stores pour une analyse plus approfondie en aval ou à des fins de visualisation et d’analyse géographique supplémentaire.

En tant que modèle d’intégration, ArcGIS GeoAnalytics Engine permet aux systèmes existants d’intégrer les fonctions spatiales et les outils d’ArcGIS GeoAnalytics Engine dans les pipelines de traitement de données existants ou les processus d’ingénierie. Une autre approche courante combine les données métier d’entreprise (stockées dans un système accessible via Spark) avec les entités géospatiales chargées à partir d’un jeu de données ArcGIS pour des rapports ou analyses. ArcGIS GeoAnalytics Engine peut lire diverses sources de données (notamment les fichiers CSV, Parquet et GeoJSON) et réécrire les résultats dans des structures de données ou services d’entités ArcGIS dans un système de fichiers Big Data ou Data Lake.

Pour des ressources supplémentaires, voir :

  • Documentation technique d’ArcGIS GeoAnalytics Engine
  • La Référence API d’ArcGIS GeoAnalytics Engine décrit les fonctions et outils spécifiques disponibles avec cette bibliothèque.

Modèles d’intégration dans ArcGIS

ArcGIS GeoAnalytics Engine inclut des modèles de déploiement documentés pour plusieurs technologies spécifiques, chacun pouvant lire les données des services d’entités ArcGIS Enterprise ou ArcGIS Online et écrire des données dans ces services. La boîte à outils GeoAnalytics pour ArCGIS Pro comprend un sous-ensemble de fonctions et d’outils spatiaux pouvant être utilisés via des processus d’analyse bureautiques.

Fonctionnalité ArcGIS Online ArcGIS Enterprise ArcGIS Location Platform ArcGIS Pro
ArcGIS GeoAnalytics Engine N/D

Prise en charge complète Prise en charge partielle


Bonnes pratiques

  • Utilisez les outils d’ArcGIS GeoAnalytics Engine s’il existe un outil approprié. Ces outils ont été conçus et optimisés pour résoudre des problèmes métier spécifiques et fournir une bonne base d’approche pour un développement ultérieur.

  • En général, l’analyse Spark convient bien aux charges de travail de type Map/Reduce, où de très grands jeux de données sont distillés en résultats spécifiques à l’aide de fonctions spatiales ou d’autres outils d’ingénierie des données, tels que les jointures ou la récapitulation.

  • La plupart des systèmes d’analyse basés sur Spark fonctionnant avec des ressources de calcul fixes, il est important de tester et d’ajuster les requêtes et les opérations pour une analyse efficace. Il est recommandé de tester une requête ou un outil sur un sous-ensemble de données avant d’exécuter une analyse pouvant fonctionner sur des milliards d’éléments ou de lignes de données.

Top