Системы аналитики больших данных обычно развертываются с использованием двух следующих шаблонов развертывания:
Выбор подходящего шаблона развертывания в основном зависит от источника данных, используемых аналитикой больших данных.
Шаблон развертывания Apache Spark использует ArcGIS в виде библиотек Apache Spark для выполнения анализа сохраненных данных из централизованных расположений (например, озер данных, хранилищ объектов, реляционных баз данных, файлов), доступных для среды Apache Spark. Шаблон развертывания Apache Spark — это наиболее распространенный шаблон для специалистов по обработке и анализу данных, выполняющих пространственный анализ больших данных.В основе шаблона развертывания Apache Spark лежит перенос пространственной аналитики в среду, знакомую специалисту по обработке и анализу данных. Это достигается с помощью библиотеки Spark, которая позволяет специалистам по обработке и анализу данных добавлять пространственные функции и процессы в новые или существующие аналитические рабочие процессы.Apache Spark предоставляет распределенные вычислительные возможности, поддерживающие доступ к широкому спектру наборов данных, надежный набор библиотечных возможностей, возможность изучения структурированной аналитики и взаимодействия с ней, а также возможность получения результатов, которые могут быть использованы заинтересованными сторонами или последующими бизнес-процессами.
Кроме того, аналитика больших данных может проводиться в рамках шаблона развертывания SaaS для потоковой передачи и анализа данных в режиме реального времени.В соответствии с этим шаблоном данные датчиков или событий в режиме реального времени поступают в предложение SaaS, анализируются в режиме реального времени или архивируются для последующего использования в определенном пользователем процессе анализа больших данных.
Между шаблонами развертывания Apache Spark и SaaS существует множество функциональных и нефункциональных различий, таких как интерфейс для разработки моделей анализа и предоставляемые конкретные аналитические инструменты и возможности. Однако в дополнение к предпочтениям организации в отношении моделей развертывания, ключевым моментом принятия решения, как правило, является вопрос о том, будет ли система анализа больших данных в основном использоваться для анализа данных и наблюдений в реальном времени или же она будет использоваться для анализа данных, сохраняющихся в существующих хранилищах больших данных в организации (например, в озерах данных). Дополнительные сведения см. на страницах шаблонов развертывания Apache Spark и SaaS.
Для получения общей информации и рекомендаций по этим подходам к развертыванию см. страницу Продукты ArcGIS и варианты развертывания обзора ArcGIS.