通过静态分析、映像初始化和堆快照提高性能

php中文网 2024-10-15 12:06:45

从整体结构到分布式系统世界，应用程序开发已经走过了漫长的道路。云计算和微服务架构的大规模采用极大地改变了服务器应用程序的创建和部署方式。我们现在拥有独立、单独部署的可立即投入使用的服务，而不是庞大的应用程序服务器
在需要时。

然而，区块上可能影响这种平稳运行的新玩家可能是“冷启动”。当第一个请求在新生成的工作线程上处理时，冷启动就会启动。这种情况需要在处理实际请求之前进行语言运行时初始化和服务配置初始化。与冷启动相关的不可预测性和执行速度较慢可能会违反云服务的服务级别协议。那么，如何应对这种日益增长的担忧呢？

本机映像：优化启动时间和内存占用

为了解决冷启动的低效率问题，我们开发了一种新颖的方法，涉及点分析、构建时的应用程序初始化、堆快照和提前 (aot) 编译。此方法在封闭世界假设下运行，要求所有 java 类在构建时都已预先确定并可访问。在此阶段，全面的点分析确定所有可访问的程序元素（类、方法、字段），以确保仅编译必要的 java 方法。

应用程序的初始化代码可以在构建过程中执行，而不是在运行时执行。这允许预先分配 java 对象并构建复杂的数据结构，然后在运行时通过“映像堆”提供这些数据结构。该映像堆集成在可执行文件中，在应用程序启动时提供立即可用性。
持续迭代执行点分析和快照，直到达到稳定状态（定点），从而优化启动时间和资源消耗。

详细工作流程

我们系统的输入是 java 字节码，它可能源自 java、scala 或 kotlin 等语言。该过程统一处理应用程序、其库、jdk 和 vm 组件，以生成特定于操作系统和体系结构的本机可执行文件 - 称为“本机映像”。构建过程包括迭代点分析和堆快照，直到达到固定点，从而允许应用程序通过注册的回调主动参与。这些步骤统称为本机映像构建过程（图 1）

图 1 – 本机映像构建过程（来源：redhat.com）

点分析

我们采用点分析来确定运行时类、方法和字段的可达性。点到分析从所有入口点（例如应用程序的主要方法）开始，迭代遍历所有可传递可达的方法，直到到达固定点（图 2）。

图 2 – 分析点

我们的指向分析利用编译器的前端将 java 字节码解析为编译器的高级中间表示(ir)。随后，ir 被转换为类型流图。在此图中，节点表示对对象类型进行操作的指令，而边表示节点之间的定向使用边，从定义指向使用。每个节点维护一个类型状态，由可以到达该节点的类型列表和空值信息组成。类型状态通过使用边传播；如果节点的类型状态发生变化，则此更改将传播到所有用途。重要的是，类型状态只能扩展；新类型可以添加到类型状态中，但现有类型永远不会被删除。该机制确保
分析最终收敛到一个固定点，导致终止。

运行初始化代码

指向分析指导初始化代码在到达本地固定点时的执行。该代码起源于两个不同的来源：类初始值设定项和在构建时通过功能接口批量执行的自定义代码：

类初始值设定项： 每个 java 类都可以有一个由方法指示的类初始值设定项，该方法初始化静态字段。开发人员可以选择在构建时和运行时初始化哪些类。
显式回调：开发人员可以通过我们系统提供的钩子实现自定义代码，在分析阶段之前、期间或之后执行。

这里提供了用于与我们的系统集成的 api。

被动api（查询当前分析状态）

boolean isreachable(class&gt; clazz);

boolean isreachable(field field);

boolean isreachable(executable method);

更多信息，请参阅 queryreachabilityaccess

active api（注册分析状态更改的回调）：

void registerreachabilityhandler(consumer<duringanalysisaccess> callback, object... elements);

void registersubtypereachabilityhandler(biconsumer<duringanalysisaccess class>&gt; callback, class&gt; baseclass);

void registermethodoverridereachabilityhandler(biconsumer<duringanalysisaccess executable> callback, executable basemethod);
</duringanalysisaccess></duringanalysisaccess></duringanalysisaccess>

更多信息，请参阅beforeanalysisaccess

在此阶段，应用程序可以执行自定义代码，例如对象分配和较大数据结构的初始化。重要的是，初始化代码可以访问当前的分析状态点，从而启用有关类型、方法或字段的可达性的查询。这是使用duringanalysisaccess 提供的各种isreachable() 方法来完成的。利用此信息，应用程序可以构建针对应用程序的可到达段进行优化的数据结构。

堆快照

最后，堆快照通过像静态字段一样跟随根指针构建对象图，以构建所有可访问对象的全面视图。然后该图填充本机图像的
图像堆，确保应用程序的初始状态在启动时高效加载。

为了生成可达对象的传递闭包，该算法遍历对象字段，使用反射读取它们的值。需要注意的是，映像生成器在 java 环境中运行。在此遍历期间，仅考虑由指向分析标记为“已读”的实例字段。例如，如果一个类有两个实例字段，但其中一个未标记为已读，则通过未标记字段可访问的对象将从图像堆中排除。

当遇到先前未通过指向分析识别其类的字段值时，该类将被注册为字段类型。此注册可确保在点分析的后续迭代中，新类型传播到类型流图中的所有字段读取和传递用法。

下面的代码片段概述了堆快照的核心算法：

Declare List worklist := []
Declare Set reachableObjects := []

Function BuildHeapSnapshot(PointsToState pointsToState)
For Each field in pointsToState.getReachableStaticObjectFields()
Call AddObjectToWorkList(field.readValue())
End For

    For Each method in pointsToState.getReachableMethods()
        For Each constant in method.embeddedConstants()
            Call AddObjectToWorkList(constant)
        End For
    End For

    While worklist.isNotEmpty
        Object current := Pop from worklist
        If current Object is an Array
            For Each value in current
                Call AddObjectToWorkList(value)
                Add current.getClass() to pointsToState.getObjectArrayTypes()
            End For
        Else
            For Each field in pointsToState.getReachableInstanceObjectFields(current.getClass())
                Object value := field.read(current)
                Call AddObjectToWorkList(value)
                Add value.getClass() to pointsToState.getFieldValueTypes(field)
            End For
        End If
    End While
    Return reachableObjects
End Function

综上所述，堆快照算法通过系统地遍历可达对象及其字段来高效地构建堆快照。这可确保图像堆中仅包含相关对象，从而优化本机图像的性能和内存占用。