Intégrations AWS et ArcGIS

Les logiciels ArcGIS sont déployés et intégrés dans Amazon Web Services (AWS) depuis plus de 15 ans, dans le cadre d’une collaboration étroite et d’une adoption continue de nouveaux services Cloud au sein d’ArcGIS.

De nombreuses organisations conçoivent des systèmes ArcGIS sur AWS, en utilisant tout un éventail de services et de concepts AWS pour construire des systèmes aux degrés de complexité variables. Cette section présente brièvement l’intégration des services AWS et contient des liens vers la documentation ou vers des conseils pertinents, le cas échéant, ainsi que vers les bonnes pratiques.

Calcul

Tout système ArcGIS basé sur AWS repose sur des ressources de calcul, qui hébergent les composants logiciels. Vous trouverez ci-après des exemples illustrant la manière dont AWS peut être utilisé pour divers scénarios ArcGIS.

  • Les instances AWS EC2 sont utilisées pour héberger un système d’exploitation en tant que machine virtuelle. Elles peuvent être utilisées pour héberger des composants ArcGIS Enterprise, des processus d’hébergement d’applications, des bases de données (lorsqu’elles n’utilisent pas une offre gérée) et pour assurer l’hébergement de clients ArcGIS Pro. Les instances EC2 sont disponibles dans une large gamme de configurations, équilibrant le calcul, la mémoire, la mise en réseau et d’autres considérations selon les classes et types d’instance. Pour les processus ArcGIS, la plupart des organisations commencent par des types d’instance généraux, puis se spécialisent en fonction des exigences spécifiques de chaque processus ou de l’utilisation observée des ressources système.

  • AWS Lambda est un service qui permet l’exécution de calculs sans serveur dans divers modèles. Les déploiements ArcGIS peuvent s’intégrer à Lambda dans plusieurs modèles courants :
    • Les fonctions Lambda Python peuvent utiliser ArcGIS API for Python, qui peut servir à exécuter des commandes sur des composants ArcGIS dans le cadre de l’exécution Lambda.

    • Les fonctions Lambda basées sur JavaScript peuvent utiliser le module ArcGIS REST JS pour interagir avec les services ArcGIS, interroger des données, accéder au contenu de l’organisation ou utiliser des services de localisation.

    • Les fonctions Lambda peuvent être déployées dans un environnement (en tant que points de terminaison de service interne) pour une utilisation externe, ou dans le cadre d’un déploiement CDN via l’intégration Lambda Edge avec Amazon CloudFront.

  • AWS EKS fournit un service Kubernetes géré qui est l’un des environnements pris en charge par ArcGIS Enterprise on Kubernetes. Les organisations peuvent intégrer ArcGIS Enterprise on Kubernetes dans des charges de travail EKS existantes, s’appuyer sur l’expérience de l’organisation et travailler dans le cadre des structures et des contraintes de réseau établies.

  • Le calcul AWS Batch propose une option qui permet d’exécuter des tâches de traitement asynchrones et évolutives en établissant un modèle d’instance EC2, puis en orchestrant l’image afin qu’elle puisse accepter les paramètres de la tâche au démarrage ou les lire depuis un système de mise en file d’attente. Un modèle d’instance peut ainsi être configuré et mis à disposition sous licence pour ArcGIS Pro ou ArcGIS Server, puis utilisé pour traiter des données géospatiales ou des processus à l’aide d’ArcGIS API for Python ou ArcPy.

Données et stockage

  • Amazon S3 est un service de stockage d’objets résilient globalement distribué, utilisé avec ArcGIS dans divers modèles. Les compartiments S3 prennent en charge des modèles d’autorisation robustes, notamment des rôles IAM pour les instances EC2, et peuvent être utilisés pour stocker des fichiers de tout type.

    • Le stockage S3 peut être utilisé comme emplacement de stockage pour les répertoires système ArcGIS Enterprise , notamment pour le répertoire de contenu du portail, ainsi que pour le stockage des configuration stores et des répertoires pour les sites ArcGIS Server. Le stockage S3 peut également être utilisé comme répertoire de cache pour stocker les caches des service de carte et d’imagerie.

    • De nombreux systèmes ArcGIS interagissent avec des données d’images stockées dans S3, souvent accessibles via une connexion au stockage Cloud et utilisées dans ArcGIS Pro ou ajoutées à un jeu de données mosaïque et publiées via ArcGIS Image Server.

    • ArcGIS Data Pipelines peut interagir avec différents formats de données dans S3 pour extraire des entités géospatiales, les enrichir ou les transformer, puis les écrire sur un service distant afin de permettre leur intégration dans un processus dans ArcGIS.

    • Dans la plupart des scénarios, la lecture directe des données vectorielles dans S3 n’est pas prise en charge pour les processus de cartographie, mais l’utilisation de ces jeux de données vectorielles dans les entrées d’analyse est courante pour les processus GeoAnalytics utilisant ArcGIS Pro ou ArcGIS GeoAnalytics Engine dans un environnement Spark dans AWS ou parallèlement. ArcGIS Pro peut également se connecter à des fichiers Apache Parquet et les lire à partir de connexions au stockage Cloud.

  • Le service Amazon RDS propose une option d’hébergement de base de données relationnelle gérée, souvent utilisée avec les systèmes ArcGIS comme méthode d’hébergement pour les géodatabase d’entreprise, bien que l’interaction directe avec une base de données RDS via des couches de requête soit également prise en charge. ArcGIS prend directement en charge tout un éventail d’offres RDS, mais seul le type spatial fourni par le système de base de données est pris en charge. Les bases de données RDS peuvent également être configurées comme relational store pour ArcGIS Enterprise on Kubernetes.

  • Amazon Redshift est une offre d’entrepôt de données qui prend en charge l’analyse évolutive de grands jeux de données d’entreprises. ArcGIS prend en charge la connexion à Amazon Redshift en tant qu’entrepôt de données Cloud via des couches de requête et des services de carte publiés créés dans ArcGIS Pro. Pour toute autre connexion d’entrepôt de données Cloud, suivez les bonnes pratiques dans ce domaine et reportez-vous à la rubrique Lacs de données et entrepôts de données.

  • Amazon EFS est un service de système de fichiers qui peut être configuré avec des instances Linux EC2 pour stocker des fichiers et du contenu. Les systèmes ArcGIS Enterprise construits sur Linux peuvent fonctionner avec une configuration EFS pour stocker du contenu et des configurations partagés dans une architecture haute disponibilité.

  • Les instances Amazon EC2 sont configurées avec un stockage par blocs monté, fourni par le service AWS EBS. Ce stockage est généralement monté sur des instances EC2 en tant que disques de stockage et est utilisé pour le stockage local des données ainsi que pour les composants de configuration ArcGIS Enterprise.

Analyse

  • ArcGIS GeoAnalytics Engine peut être déployé dans le service Amazon EMR pour fournir des fonctions et des outils d’analyse géospatiale dans l’environnement EMR. Pour les organisations qui utilisent déjà l’environnement EMR, ce modèle d’intégration logicielle permet à un processus d’ingénierie ou d’analyse des données d’utiliser les outils fiables de GeoAnalytics Engine dans un environnement familier. Cet article de blog présente un cas d’utilisation de ce modèle d’intégration.

Mise en réseau

  • Les équilibreurs de charge élastiques AWS offrent des fonctionnalités puissantes pour les systèmes ArcGIS, notamment ceux qui se trouvent dans une configuration haute disponibilité. L’équilibrage de charge et l’envoi par proxy inverse sont également courants dans les systèmes autres que les systèmes haute disponibilité et sont fréquemment utilisés pour transmettre le trafic client d’Internet ou d’une zone de réseau plus large aux composants de serveur back-end d’ArcGIS Enterprise.

  • Le service Amazon API Gateway fournit une méthode pour définir des points de terminaison et des méthodes HTTP spécifiques, en procédant à la redirection vers des fonctions Lambda back-end, des points de terminaison de service AWS ou d’autres services Web logiciels, par exemple un service ArcGIS Enterprise. L’utilisation du service API Gateway est guidée par les mêmes recommandations que les autres technologies de gestion d’API.

  • Amazon CloudFront est un service CDN géré qui peut fournir une mise en cache globale des pages Web ou des réponses des services Web. En s’appuyant sur le vaste réseau de points de présence d’AWS, une distribution CloudFront peut considérablement améliorer l’accès des utilisateurs aux applications Web et aux ressources statiques en mettant en cache les réponses près de l’utilisateur. Les applications Web géospatiales créées avec ArcGIS Maps SDK for JavaScript sont de bons candidats pour la distribution et l’accélération CDN. Les services Web d’ArcGIS Enterprise peuvent être compatibles avec AWS CloudFront dans certains scénarios, mais il est important de gérer soigneusement la configuration et l’expiration du cache afin de s’assurer que les utilisateurs reçoivent la bonne réponse aux requêtes et n’accèdent pas à des données ou configurations obsolètes.

Expériences de bureau virtuel

De nombreuses organisations utilisent des interfaces de bureau virtuel (VDI) pour offrir des expériences d’application riches aux utilisateurs. Dans un système ArcGIS, cela correspond le plus souvent à une configuration d’ArcGIS Pro, qui peut être hébergée dans un emplacement central du réseau, mais accessible à distance par des utilisateurs depuis de nombreuses localisations. Ce modèle garantit l’optimisation de la communication depuis la session ArcGIS Pro vers les données et services, tandis que les seules interactions transmises sur de plus longues distances à un utilisateur sont le retour visuel d’une session distante et un ensemble de contrôles en entrée de l’utilisateur.

Services AWS supplémentaires

Pour les organisations qui explorent l’infrastructure en tant que code et l’automatisation du déploiement de logiciels, les modèles ArcGIS CloudFormation constituent un excellent point de départ pour créer un ensemble propre à l’environnement de modèles pouvant être utilisés pour déployer une architecture système particulière.

En combinant le déploiement d’infrastructures de ressources de mise en réseau, de calcul et de stockage avec l’exécution de scripts pour déployer le logiciel ArcGIS avec ArcGIS PowerShell DSC ou Chef, les modèles CloudFormation fournissent un modèle de déploiement reproductible défini par un code, favorisant la cohérence, la fiabilité et l’alignement avec la stratégie informatique de l’entreprise.

Cognito

AWS Cognito propose tout un éventail d’offres de service liées à l’identité et peut être utilisé comme fournisseur OpenID Connect (OIDC) pour ArcGIS Enterprise ou ArcGIS Online. Les pools d’identités Cognito peuvent être établis en utilisant divers modèles de connexion, puis des comptes utilisateurs ArcGIS peuvent être créés pour permettre la connexion basée sur l’identité Cognito.

Top