实时数据流和分析系统

借助实时数据流和分析系统,组织可以从实时源(例如传感器、资产和其他动态数据源)中提取数据并对数据进行可视化和分析。 数据可用于实时制图、存储为时空大数据以供进一步分析,并基于发生的事件触发操作和警报。 此模式将连接到实时数据源以及其他快速发布数据源,例如物联网 (IoT)。 源和其他流数据源可以为移动或静止状态,可以对其进行实时分析,并传播到外部系统和应用程序。

实时数据流和分析系统模式通过各种特征为组织创造价值,例如:

  • 集成并连接到实时数据源,例如车辆位置、传感器、人员和其他来源(其中包括云原生服务和队列),以改进实时、基于地理位置的决策制定。
  • 对高速数据执行实时分析,推动自动化操作,并在检测到感兴趣的模式时实时推送通知和警报。
  • 存储任何频率(从间歇性到非常频繁)的观测数据,以供将来的可视化和分析使用。

如果您不熟悉 ArcGIS 系统模式,请先参阅简介

用户角色和工作流

最常与实时数据流和分析系统进行交互的用户角色,以及其通常使用此系统执行的工作流和任务类型,包括:

  • 数据分析师、科学家和工程师。 数据分析师、科学家和工程师使用此系统(其中包括实时数据源以及存储的历史实时数据)来设计、开发和执行分析例程。 当使用实时数据源时,这些角色通常需要设计发布到实时数据流和分析系统的分析模型,从而产生新的派生输出,其中可能包含新源或已触发的警报。 当使用静态历史实时数据时,这些用户角色与此系统的交互方式类似于大数据分析系统
  • GIS 分析师。 GIS 分析师通常与数据分析师、科学家和工程师协同使用此系统。 GIS 分析师通常直接使用该系统,负责设置源、执行分析工作流等任务;同时为上述数据分析师、科学家和工程师角色提供支持,以确保理解重要的空间概念,并应用使用地理空间数据、分析方法以及工具的最佳实践。
  • 数据所有者。 数据所有者对实时数据流和分析系统中使用的源和数据集负责。 将源整合到系统中时,可能需要咨询源数据所有者。 当存储历史实时数据时,数据所有者通常参与数据管理的设计和监督方面,其中包括数据建模、质量控制和治理。
  • 数据管理员。 数据管理员通常负责对实时数据流和分析系统中使用的源和数据集进行日常管理。 常见的工作流和活动可能包括加载和导入数据、审核数据更新以及构建和管理数据管理工作流。

要充分发挥实时数据流和分析系统的价值,除了数据分析师、科学家和工程师或者具有这两种角色的技能的个人之外,还可以考虑引入 GIS 分析师。

应用程序

实时数据流和分析系统将公开 API 和工具,以及数据分析师、科学家和工程师熟悉的设计、建模和管理界面。 这些界面因部署模式而异,但两种部署模型均包含一个 web 界面,用于管理实时数据源,以及设计、发布和执行实时数据分析。

ArcGIS 提供了各种应用程序,其中包括仪表盘、Web 应用程序构建器、原生移动应用程序和桌面应用程序,这些应用程序可以处理实时源以及从实时数据流和分析系统发出的数据。 这些应用程序通常与自助制图、分析和共享系统或其他 ArcGIS 系统模式结合(或通过集成)提供。 了解有关使用、集成和组合系统模式的详细信息。

此系统还包含一个门户网站,作为 ArcGIS 系统的通用 web 界面。 在实时数据流和分析系统中,门户网站用于管理用户和内容,以及管理系统组件。 ArcGIS Pro 是一款专为 GIS 专业人员设计的桌面应用程序,也常用于更高级的空间和 GIS 分析工作。

使用 ArcGIS Maps SDK 构建的自定义应用程序(包括沉浸式体验 (XR))也常用于实时数据流和分析系统。

有关 ArcGIS 提供的所有应用程序的详细信息,请参阅 ArcGIS 概览中的应用程序架构

功能

以下介绍了实时数据流和分析系统提供的主要功能。 以下未列出在实时数据流和分析工作流中使用,但通常由其他系统提供的功能,例如底图和位置服务系统提供的其他位置服务。 了解有关相关系统模式的详细信息。

注:

以下所述所有功能并非在所有部署模式中均可用。 有关适用于各种部署环境的功能的详细信息,请参阅选择部署模式和部署模式页面。

  • 源获取可将系统连接到实时观测数据的外部源,例如物联网 (IoT)、消息代理和第三方 API。 这些外部源称为源,可将其配置为实时流和分析系统的输入。 受支持的源类型因部署模式而异。
  • 借助数据获取,可将数据加载到系统中以进行批处理分析和处理。 此系统模式不支持直接在 ArcGIS 外部的数据源位置执行大数据分析。 在实时数据流和分析系统中对存储数据执行的所有批处理分析和处理均在系统内完成。 了解有关大数据分析系统的详细信息。
  • 借助空间连接和关系,可基于空间关系来组合来自两个源或数据集的行。 可以应用各种空间关系,包括相交、擦除、联合、标识和对称差异,但功能因所选部署模式而有所不同。
  • 模式分析用于标识数据中的空间和时间模式。 包括查找热点、查找相似位置等工具,以及用于对趋势进行建模和生成预测的各种基于回归的分析方法。 通常针对大数据(而非实时源)执行模式分析。
  • 邻近分析用于确定空间数据与其他空间数据的接近程度。 包括诸如创建缓冲区和计算距离等工具。
  • 汇总分析用于将数据聚合或汇总到更高阶的数据结构中。 包括诸如聚合点、计算密度和范围内汇总等工具。 通常针对存储数据(而非实时源)执行汇总分析。
  • 追踪分析适用于与不同实体(通常为移动对象)相关的启用时间的观测。 其中包括重新构建轨迹、捕捉到网络等工具,以及用于分析旅程和停留位置的工具。
  • 地理围栏是实时空间分析的一种形式,其中系统将使用感兴趣区域(通常是面区域)对要素(通常是追踪点)进行评估。 最常见的是对基于点的观测值进行分析,以确定这些值是否已进入或退出了虚拟周界。
  • 数据管理支持对实时源和大数据中的几何和其他字段进行操作。 包括诸如计算字段、映射以及映射字段等工具。
  • 借助自定义输入连接器,可以使用代码开发新的输入连接器。 自定义输入连接器的选项因部署模式而异;有关详细信息,请参阅选择部署模式
  • 借助自定义分析工具,可以使用代码开发新的分析工具。 自定义分析工具的选项因部署模式而异;有关详细信息,请参阅选择部署模式
  • 借助自定义输出连接器,可以使用代码开发新的输出连接器。 自定义输出连接器的选项因部署模式而异;有关详细信息,请参阅选择部署模式
  • 实时数据和分析输出的映射和可视化是提供上下文并帮助揭示数据中的模式、趋势和关系的有效步骤。 可视化和映射类似于使用非空间数据绘制图表;分析师能够利用可视化和映射来验证自己的分析、迭代并创建可共享且引人入胜的结果。
  • 数据发布和托管为提取到系统中的数据或者从实时源中持久化的数据提供数据即服务的安全存储、管理和访问。 在系统中托管的数据通常以要素服务或要素图层的形式提供。
  • 源发布和托管将提供要发布到系统并由系统托管的新源。 系统托管的源通常以流服务或流图层的形式提供。
  • 发送或存储消息是实时分析的输出,用于将处理后的源数据(消息)发送或存储到外部系统,其中包括消息代理、对象存储以及诸如电子邮件和 SMS 等其他消息传递系统。 用于发送和存储消息的受支持输出类型因部署模式而异。
  • ArcGIS 支持共享分析结果,但这被视为超出实时数据流和分析系统的范围。 有关详细信息,请参阅相关系统模式

架构注意事项

实时数据流和分析系统使用 ArcGIS 构建而成。 本部分将更加详细地介绍实时数据流和分析系统如何与 ArcGIS 架构的特定方面保持一致并侧重于其特定方面。

有关更加详细的架构注意事项,请参阅选择部署模式

数据(持久)

实时数据流和分析系统数据架构注意事项

实时数据流和分析系统将与实时源以及大数据源配合使用。

实时源是快速产生的外部实时观测数据源,例如物联网 (IoT)、消息代理和第三方 API。 可将实时源提取到实时数据流和分析系统中,从而对实时观测数据进行处理、分析并从系统中输出。 输出类型包括对象存储以及源和其他消息代理和系统。 受支持的源和输出类型因部署模式而异。

实时数据流和分析系统包含托管 NoSQL、基于文档的大数据存储(用于管理实时源中持久化的大数据)。 了解有关 ArcGIS 托管数据存储的详细信息。

服务(逻辑)

实时数据流和分析系统服务架构注意事项

实时数据流和分析系统将为 ArcGIS 提供实时分析服务,具体来说,在 SaaS 部署模式中,将提供大数据分析服务。

实时数据流和分析系统还可用于对系统中存储的大数据进行查询、访问、空间参考、丰富和管理。 将此系统用于提取、转换和加载 (ETL) 工作流也十分常见。 实时数据流和分析系统可利用带有底图和参考图层的交互式制图来可视化分析结果。 通过门户服务共享分析结果和其他内容十分常见,但这通常通过另一个 ArcGIS 系统完成。 有关详细信息,请参阅相关系统模式

应用程序(表示)

实时数据流和分析系统应用程序架构注意事项

实时数据流和分析系统的主要输出是此系统模式范围之外的其他系统和应用程序所使用的消息、源和其他服务。 此系统通常只公开数据分析师、科学家和工程师熟悉的较低级别的用户界面。 这些用户界面或应用程序因所选部署模式而有所不同。 有关详细信息,请参阅应用程序

支持

实时数据流和分析系统在支持需求方面可能存在差异。

当主要用于实时数据流时,通常与实时分析结合使用,系统输出的源和消息通常用于业务或任务关键工作流。 在这些情况下,系统的设计和运行应考虑到高水平的可靠性、安全性、可观测性、性能和可扩展性。 强大的治理实践和标准也有助于确保实时数据流和分析系统能够根据业务需求成熟、扩展和发展,同时满足非功能性 IT 要求。

当主要用于历史观测数据的批量分析和处理时,该系统在可靠性等方面的技术要求可能相对较低。 但是,对于这些用例,仍需考虑系统托管大数据存储的可扩展性以及性能和安全性。

与其他系统集成可以采取实时源以及大数据接入实时数据流和分析系统的形式。 实时数据流和分析系统的输出通常也集成到组织企业内的其他系统中,因此也可能支持系统管理员未知或不可用的业务操作。 这通常需要使用元数据、监控和服务级别协议 (SLA)。

有关常规支持和架构注意事项,请参阅架构实践以及 ArcGIS 优化架构框架的架构支柱

相关系统模式

实时数据流和分析系统可以与其他 ArcGIS 系统模式集成或组合。 一些常见示例包括:

有关集成或组合系统模式的详细信息,请参阅使用系统模式

示例

此系统模式的行业特定系统示例包括:

  • 自然资源。 石油和管道公司可以使用此模式将来自 SCADA 系统的高速数据集成到其资产的实时图片中。 此外,也可以使用此模式来追踪车辆、分析移动活动、监控天气和环境,并根据检查结果自动触发工单。
  • 公共事业。 电力公司可以使用此模式来监控诸如雷击、洪水和野火等灾害,并评估这些灾害是否威胁基础设施。 天然气公用事业公司可以使用此模式来监控智能表计的读数,追踪车辆和设备,并分析移动工作人员的活动和安全。 电信运营商可以监控天线性能并查看通话中断模式,以突出显示可能需要改进网络的区域。
  • 供水和废水。 借助此模式,水务公司能够可视化和分析来自智能水表和 SCADA 系统的流数据。 可以利用此数据来实时监控流量、检测泄漏并确定其位置,并分析消耗趋势以确定水资源异常损耗。
  • 交通运输。 交通运输组织可以使用此模式来监控和分析自动车辆定位 (AVL) 和运输资产数据,以追踪服务车辆的工作区域活动和路线偏差。 也可以用于追踪资产和设备,检测交通异常,并实时推送气象信息和停车位动态数据。 此外,可以使用来自船舶和飞机的自动识别系统 (AIS) 源和其他遥测数据来监控合规性并优化港口和机场调度。 机场可以分析候检队列和航站楼内的客流动态,并且可以监控地面上的飞机位置,从而更好地协调燃油补给车、行李装卸车及检修车辆。
  • 公共安全。 公共安全组织可以使用此模式来追踪和存档人员的位置,识别车辆,使用车牌追踪其位置,使用来自 ShotSpotter 和类似 API 的数据检测枪声,并监控潜在的安全威胁。 公共安全组织也可以使用此模式对关键基础设施进行事件检测和监控。
  • 地方政府。 智慧城市可以使用来自联网的传感器、车辆、仪表和其他设备的数据来追踪市政资产、监控警务活动并制定数据驱动的决策。 借助此模式,可以实现城市/县域范围内的数据源追踪、人员精准调度以及系统和路权资产的自动化管理。
  • 国家政府。 与地方政府类似,国家政府机构可以使用此模式来监控和管理基础设施、资产、人员和设施点。 此外,也可以综合与农业、天气、船只位置、灾害、地震活动、空气质量和其他现象相关的数据源,然后将这些数据应用于研究、预测和决策。
Top