GeoAnalytics Engine を用いた Spark 環境

多くの組織では、統合データ システムや統合解析プラットフォームを活用して、企業のデータ資産を管理および運用しています。 こうした統合の傾向により、データ ソースの近くに配置された計算リソースに焦点を当てたデプロイメントおよびアーキテクチャー パターンが導入されました。これらは、しばしば Apache Spark で構築されたデータ エンジニアリングおよび解析環境を通じてアクセスされます。 ビッグ データ解析システム パターンと同様に、ビッグ データの空間解析と時間解析の結果は、さらなる下流解析か、視覚化とさらなる地理解析のためにデータ ストアに書き戻されます。

統合パターンとして、GeoAnalytics Engine を利用することで、既存システムが GeoAnalytics Engine の空間機能ツールを既存のデータ処理パイプラインやエンジニアリング ワークフローに統合することが可能になります。 もう 1 つの一般的なアプローチは、エンタープライズ ビジネス データ (Spark 経由でアクセス可能なシステムに保存されている) と、ArcGIS データセットから読み込まれた地理空間フィーチャを組み合わせて、レポートや解析を行う方法です。 GeoAnalytics Engine は CSV、Parquet、GeoJSON などさまざまなデータ ソースを読み込むことができ、結果を ArcGIS のフィーチャ サービスや、データ レイクまたはビッグ データ ファイル システム内のデータ構造に書き戻すことができます。

追加のリソースについては、以下をご参照ください:

  • ArcGIS GeoAnalytics Engine のの技術文書
  • GeoAnalytics Engine の API リファレンスでは、このライブラリーで利用可能な特定の機能やツールが説明されています。

ArcGIS における統合パターン

ArcGIS GeoAnalytics エンジンには、いくつかの特定の技術向けに文書化されたデプロイメント パターンが含まれており、それぞれが ArcGIS Enterprise や ArcGIS Online のフィーチャ サービスからデータを読み込み、書き戻すことができます。 ArCGIS Pro の GeoAnalytics ツールボックスには、デスクトップ解析ワークフローを介して使用できる空間機能やツールの一部が含まれています。

機能 ArcGIS Online ArcGIS Enterprise ArcGIS Location Platform ArcGIS Pro
ArcGIS GeoAnalytics Engine N/A

フルサポート 一部サポート


ベスト プラクティス

  • 適切なツールが存在する場合は、GeoAnalytics Engine のツールを活用してください。 これらのツールは、特定のビジネス上の問題を解決するために設計および最適化されており、さらなる開発のための優れた基盤を提供します。

  • 一般的に、Spark 分析は Map-Reduce スタイルのワークロードに適しています。これは、空間関数や結合、集計などのデータ エンジニアリング ツールを用いて、非常に大規模なデータセットを特定の結果に絞り込みます。

  • Spark ベースの解析システムのほとんどは、固定的な計算リソース内で動作するため、効果的な解析を行うにはクエリーや操作のテストと調整が重要です。 数十億ものデータ要素や行にまたがる解析を実行する前に、データのサブセットを対象にクエリーやツールをテストすることをおすすめします。

Top