ビッグデータ解析システムのデプロイメントパターンの選択

ビッグデータ解析システムは、通常、次の 2 つのデプロイメントパターンを使用してデプロイされます。

適切なデプロイメントパターンの選択は、主にビッグデータ解析で使用されるデータのソースに依存します。

Apache Spark デプロイメントパターンでは、ArcGIS を Apache Spark ライブラリ形式として利用して、Apache Spark 環境からアクセス可能な一元化された場所 (データレイク、オブジェクトストレージ、リレーショナルデータベース、ファイルなど) から永続化されたデータに対して解析を実行します。 Apache Spark デプロイメントパターンは、地理空間ビッグデータ解析を行うデータサイエンティストにとって最も一般的なパターンです。Apache Spark デプロイメントパターンの基本は、データサイエンティストが使い慣れた環境に空間解析を持ち込むことです。これは、データサイエンティストが新規または既存の解析ワークフローに空間関数とプロセスを追加できるようにする、Spark ライブラリを使用して実現されます。Apache Spark が提供する分散コンピューティング機能は、広範なデータセットや堅牢な機能ライブラリーセット、構造化された解析の探索/操作機能、および関係者や下流のビジネスプロセスで利用できる結果の生成機能などへのアクセスをサポートします。

また、ビッグデータ解析は、リアルタイムデータストリーミングと分析の SaaS デプロイメントパターンの一部として実行することもできます。このパターンでは、リアルタイムのセンサーまたはイベントデータが SaaS 製品に取り込まれ、リアルタイムで解析されるか、ユーザー定義のビッグデータ解析プロセスで後で使用するためにアーカイブされます。

Apache Spark と SaaS のデプロイメントパターンには、解析モデルを設計するためのインターフェイスや提供される特定の解析ツールと機能など、機能面および機能面以外の違いが多数あります。ただし、ビッグデータ解析システムを主にリアルタイムデータと観測の解析に使用するのか、あるいはシステムを使用して組織内の既存のビッグデータストア (データレイクなど) に保存されているデータを解析するために使用するのかは、デプロイメントモデルに対する組織の好みに加えて、重要な決定ポイントになる傾向があります。詳細については、Apache Spark と SaaS のデプロイメントパターンのページをご参照ください。

これらのデプロイメントアプローチに関する一般的な情報と考慮事項については、ArcGIS の概要の「ArcGIS 製品とデプロイメントオプション」ページをご参照ください。

ビッグ データ解析システムのデプロイメント パターンの選択

トピックの内容

ビッグデータ解析システムのデプロイメントパターンの選択