预测试

预测试是我们流程中的一个步骤,旨在改进正式测试的结果。 可通过预测试实现以下目的:

  • 识别可能阻碍系统在负载下的性能和可用性的系统瓶颈
  • 以迭代方式尝试不同的设置和配置
  • 简化更正式的负载测试过程

最初的物理架构与之前测试的配置有 SAP HANA 的基础网络信息管理系统几乎相同,只是添加了一个 AWS 客户端 VPN 终端节点,用于连接移动设备。 在预测试期间,我们确定系统无法通过附加工作负载支持预期负载,如下所示。 随后对架构进行了适当的调整,如物理架构中所述。 您可以在测试结果部分看到进行这些修改后的最终测试结果。

注:

在引入更改(例如新的工作流或增加的工作负载)后,建议对系统进行测试和验证,以在将更改引入生产环境之前识别潜在的系统影响。

在四倍设计负载下进行预测试

该系统首先通过在没有移动工作流的情况下运行的基础网络信息管理工作流进行测试,如下图左侧所示。 除了测试开始时由于安装 Windows Defender 更新而导致 ArcGIS Web Adaptor 02 中出现峰值外,资源利用率相对较低。

将其与图右侧进行比较,该图说明了在四倍负载之上添加移动工作流如何导致 ArcGIS Web Adaptors 和 Portal for ArcGIS 实例中的 CPU 使用率显著增加。 ArcGIS Web Adaptor 即将达到饱和状态,这会导致请求处理速度变慢或超时。 所有四个 GIS 服务器和数据库的 CPU利用率(橙色)和磁盘利用率(金色)也变高。 这是由于离线工作流中的下载步骤,其中 2.66 GB 的离线区域正在被大量移动工作人员下载。

比较不带移动工作流和带移动工作流的四倍设计负载的测试结果

下面(左侧)所示的仅基础负载的开放请求指示了正在处理负载的系统。 在测试初期,开放请求数量会少量增加,但最多有 19 名编辑者和 11 名查看者。 但是,在添加附加移动负载(右侧)后,请求会增加到 42 个桌面(查看者和编辑者)和 127 个并发移动请求,在下载完成后负载会下降。 此模式表示在测试的下载步骤中,当用户等待离线区域下载完成时,速度会变慢。

并发请求比较

实例大小

在预测试期间,我们观察到离线区域(大小为 2.66 GB)的下载时间很长,超过 30 分钟(见下图)。 经过一些故障排除后,我们确定该问题源于 ArcGIS Web Adaptor 和 Portal for ArcGIS 实例上的极高 CPU 利用率,这限制了吞吐量并导致下载超时。 为了解决这个问题,ArcGIS Web Adaptor 实例从 2 个 vCPU 增加到 8 个 vCPU,Portal for ArcGIS 实例从 4 个 vCPU 增加到 8 个 vCPU。

优化前后的下载时间

离线工作流的下载步骤尤其受益于 ArcGIS Web Adaptor 和 Portal for ArcGIS 实例大小的增加,下载时间缩短了 41%。 但是,如果不进行大量下载,该容量会过剩。 在生产环境中,我们会寻找某种方法在高峰时段扩展这些组件,并在不需要时减小实例大小以降低成本。 因此,为了适当平衡性能和成本,需要在平衡离线地图大小的同时(尽可能减小地图大小,同时覆盖必要的区域)优化资源。

服务实例配置

在 ArcGIS Enterprise 中,已发布服务的服务实例称为 ArcSOC 进程。 可通过不同的方式配置 ArcSOC,以避免漫长的等待时间和糟糕的用户体验。 通常,如果繁忙的 ArcSOC 数量超过分配给服务的最大值,则等待时间将增加,直到 ArcSOC 可用。 但是,如果所有服务中的最大 ArcSOC 数量大于 vCPU 可用数量,则等待时间也会随着所有 vCPU 变得繁忙而增加。 因此,需要监控和管理 ArcSOC 与可用 vCPU 的比率,尤其是在引入系统更改后。

如果两台托管服务器上有 16 个可用 vCPU,则移动公共设施网络服务和只读天燃气公共设施网络服务的初始服务实例设置均设置为以下内容:

  • 最小值:8
  • 最大值:8

由于只读天然气公共设施网络服务在大部分预测试中都以最大 ArcSOC 利用率运行,而移动服务的可用 ArcSOC 过多,因此我们了解到需要重新配置一些服务。 有关优化前后 ArcSOC 利用率的比较,请参见下图。

优化前后的只读公共设施网络服务实例观测值

优化前后的移动公共设施网络服务实例观测值

移动公共设施网络服务的服务实例从最小值和最大值 8 个减少到最小值和最大值 6 个。 天燃气公共设施网络服务的服务实例从最小值和最大值 8 个增加到最小值和最大值 10 个。 更改后,图表显示两种服务之间的分布更加均匀,用户等待时间也显着缩短。

预测试结果

通过添加移动工作负载对原始基础网络信息管理系统进行预测试,有助于识别和纠正系统瓶颈和错误配置,否则这些瓶颈和配置错误会对生产环境中的系统性能和最终用户体验产生负面影响。 我们根据预测试结果进行了以下系统调整,并在执行正式测试之前纳入这些调整。

  • ArcGIS Web Adaptor 实例的大小已从 2 个 vCPU 增加到 8 个 vCPU。
  • Portal for ArcGIS 实例的大小从 4 个 vCPU 增加到 8 个 vCPU。
  • 优化了离线区域的大小,尽可能减小其大小,同时覆盖必要的区域。
  • 调整了 ArcSOC 配置,以提供更均匀的利用率分布,并减少移动公共设施网络服务和天然气公共设施网络服务的等待时间。
Top