GeoAnalytics Engine を用いた Spark 環境

多くの組織では、統合データシステムや統合解析プラットフォームを活用して、企業のデータ資産を管理および運用しています。こうした統合の傾向により、データソースの近くに配置された計算リソースに焦点を当てたデプロイメントおよびアーキテクチャーパターンが導入されました。これらは、しばしば Apache Spark で構築されたデータエンジニアリングおよび解析環境を通じてアクセスされます。ビッグデータ解析システムパターンと同様に、ビッグデータの空間解析と時間解析の結果は、さらなる下流解析か、視覚化とさらなる地理解析のためにデータストアに書き戻されます。

統合パターンとして、GeoAnalytics Engine を利用することで、既存システムが GeoAnalytics Engine の空間機能やツールを既存のデータ処理パイプラインやエンジニアリングワークフローに統合することが可能になります。もう 1 つの一般的なアプローチは、エンタープライズビジネスデータ (Spark 経由でアクセス可能なシステムに保存されている) と、ArcGIS データセットから読み込まれた地理空間フィーチャを組み合わせて、レポートや解析を行う方法です。 GeoAnalytics Engine は CSV、Parquet、GeoJSON などさまざまなデータソースを読み込むことができ、結果を ArcGIS のフィーチャサービスや、データレイクまたはビッグデータファイルシステム内のデータ構造に書き戻すことができます。

追加のリソースについては、以下をご参照ください:

ArcGIS GeoAnalytics Engine のの技術文書。
GeoAnalytics Engine の API リファレンスでは、このライブラリーで利用可能な特定の機能やツールが説明されています。

ArcGIS における統合パターン

ArcGIS GeoAnalytics エンジンには、いくつかの特定の技術向けに文書化されたデプロイメントパターンが含まれており、それぞれが ArcGIS Enterprise や ArcGIS Online のフィーチャサービスからデータを読み込み、書き戻すことができます。 ArCGIS Pro の GeoAnalytics ツールボックスには、デスクトップ解析ワークフローを介して使用できる空間機能やツールの一部が含まれています。

機能	ArcGIS Online	ArcGIS Enterprise	ArcGIS Location Platform	ArcGIS Pro
ArcGIS GeoAnalytics Engine			N/A

フルサポート 一部サポート

ベストプラクティス

適切なツールが存在する場合は、GeoAnalytics Engine のツールを活用してください。これらのツールは、特定のビジネス上の問題を解決するために設計および最適化されており、さらなる開発のための優れた基盤を提供します。
一般的に、Spark 分析は Map-Reduce スタイルのワークロードに適しています。これは、空間関数や結合、集計などのデータエンジニアリングツールを用いて、非常に大規模なデータセットを特定の結果に絞り込みます。
Spark ベースの解析システムのほとんどは、固定的な計算リソース内で動作するため、効果的な解析を行うにはクエリーや操作のテストと調整が重要です。数十億ものデータ要素や行にまたがる解析を実行する前に、データのサブセットを対象にクエリーやツールをテストすることをおすすめします。

GeoAnalytics Engine を用いた Spark 環境

ArcGIS における統合パターン

ベスト プラクティス

トピックの内容

ベストプラクティス