# 线程转储归并机制

性能概要是APM系统中的一个增强特性. 我们使用线程转储来估算方法执行时间，而不是添加许多局部span。这样，与使用分布式跟踪来定位慢方法相比，资源成本要低得多。该特性适用于生产环境。本文档介绍如何将线程转储作为堆栈树归并到最终报告中.

# 线程分析

# 读取数据并进行转换

从数据库中读取数据并将其转换为gRPC中的数据结构.

st=>start: Start
e=>end: End
op1=>operation: Load data using paging
op2=>operation: Transform data using parallel

st(right)->op1(right)->op2
op2(right)->e

复制代码并将其粘贴到此链接以生成流程图.

使用流按页读取数据(每页50条记录).
以并行流的形式将数据转换为gRPC数据结构.
合并到数据列表中.

# 数据分析

使用Java并行流中的group by和collector模式根据数据库记录中的第一个堆栈元素进行分组，并使用collector执行数据聚合. 生成一个多根树.

st=>start: Start
e=>end: End
op1=>operation: Group by first stack element
sup=>operation: Generate empty stack tree
acc=>operation: Accumulator data to stack tree
com=>operation: Combine stack trees
fin=>operation: Calculate durations and build result

st(right)->op1->sup(right)->acc
acc(right)->com(right)->fin->e

复制代码并将其粘贴到此链接以生成流程图.

按第一个堆栈元素分组:使用每个堆栈中的第一级元素分组，确保堆栈具有相同的根节点e.
生成空栈:生成多个顶级空树，为下一步做准备，生成多个顶级树的原因是可以并行地添加原始数据，而不需要生成锁.
累加数据至栈中: 将每个线程转储添加到生成的树中.
1. 遍历线程转储中的每个元素，以查找父元素中是否有具有相同代码签名和相同堆栈深度的子元素. 如果不是，则添加此元素.
2. 保留原节点中的转储序列和时间戳.
合并所有堆栈: 使用与 累加器 相同的规则将所有树结构组合成一个树结构. 1.使用LDR遍历树节点。使用 堆栈 数据结构来避免递归调用，每个堆栈元素表示需要合并的节点. 2. 合并两个节点的方法是合并其子节点的列表. 如果它们具有相同的代码签名和相同的父节点，则在此节点中保存转储序列和时间戳. 否则，需要将节点作为新的子节点添加到目标节点中.
计算时间并生成结果: 计算相关统计数据并生成响应.
1. 使用与 合并所有堆栈 步骤相同的遍历节点逻辑. 转换为GraphQL数据结构，并将所有节点放到一个列表中，以用于后续的持续时间计算.
2. 并行计算每个节点的持续时间. 对于每个节点，对序列进行排序，如果有两个连续序列，持续时间应该添加这两个seq的时间戳的持续时间.
3. 并行计算每个节点的执行. 对于每个节点，当前节点的持续时间应该减去所有子节点消耗的时间.

# 配置文件数据调试

请按照导出工具打包配置文件数据. 解压配置文件数据并使用分析主要功能运行.