ビッグ データ解析システムは、通常、次の 2 つのデプロイメント パターンを使用してデプロイされます。
適切なデプロイメント パターンの選択は、主にビッグ データ解析で使用されるデータのソースに依存します。
Apache Spark デプロイメント パターンでは、ArcGIS を Apache Spark ライブラリ形式として利用して、Apache Spark 環境からアクセス可能な一元化された場所 (データ レイク、オブジェクト ストレージ、リレーショナル データベース、ファイルなど) から永続化されたデータに対して解析を実行します。 Apache Spark デプロイメント パターンは、地理空間ビッグ データ解析を行うデータ サイエンティストにとって最も一般的なパターンです。Apache Spark デプロイメント パターンの基本は、データ サイエンティストが使い慣れた環境に空間解析を持ち込むことです。 これは、データ サイエンティストが新規または既存の解析ワークフローに空間関数とプロセスを追加できるようにする、Spark ライブラリを使用して実現されます。Apache Spark が提供する分散コンピューティング機能は、広範なデータセットや堅牢な機能ライブラリー セット、構造化された解析の探索/操作機能、および関係者や下流のビジネス プロセスで利用できる結果の生成機能などへのアクセスをサポートします。
また、ビッグ データ解析は、リアルタイム データ ストリーミングと分析の SaaS デプロイメント パターンの一部として実行することもできます。このパターンでは、リアルタイムのセンサーまたはイベント データが SaaS 製品に取り込まれ、リアルタイムで解析されるか、ユーザー定義のビッグ データ解析プロセスで後で使用するためにアーカイブされます。
Apache Spark と SaaS のデプロイメント パターンには、解析モデルを設計するためのインターフェイスや提供される特定の解析ツールと機能など、機能面および機能面以外の違いが多数あります。 ただし、ビッグ データ解析システムを主にリアルタイム データと観測の解析に使用するのか、あるいはシステムを使用して組織内の既存のビッグデータ ストア (データ レイクなど) に保存されているデータを解析するために使用するのかは、デプロイメント モデルに対する組織の好みに加えて、重要な決定ポイントになる傾向があります。 詳細については、Apache Spark と SaaS のデプロイメント パターンのページをご参照ください。
これらのデプロイメント アプローチに関する一般的な情報と考慮事項については、ArcGIS の概要の「ArcGIS 製品とデプロイメント オプション」ページをご参照ください。