“Performance Metrics”(性能指标)视图可显示每种类型的停滞占总仿真时间或总停滞计数的百分比。
图 1. “Performance Metrics”视图
- 单击“Performance Metrics”视图。
- 从下拉列表中选择停滞类型。指标区分不同类型的停滞。它将显示仿真结果中现有的停滞。
- Lock Stall Time (ps)(锁定停滞时间 (ps))
- 锁定停滞时间百分比,在此期间获取 AI 引擎拼块内的缓冲器。
- Lock Stall Count(锁定停滞计数)
- 特定拼块中锁定停滞的数量。
- Memory Stall Time (ps)(存储器停滞时间 (ps))
- 存储器停滞时间百分比,在此期间 AI 引擎拼块内的存储器访问存在冲突。
- Memory Stall Count(存储器停滞计数)
- 特定拼块中存储器停滞的数量。
- Stream Stall Time (ps)(串流停滞时间 (ps))
- 由于串流已满或为空而导致串流停滞时间的百分比。
- Stream Stall Count(串流停滞计数)
- 特定拼块中串流停滞的数量。
- Cascade Stall Time (ps)(级联停滞时间 (ps))
- 由于级联串流已满或为空而导致级联串流停滞时间的百分比。
- Cascade Stall Count(级联停滞计数)
- 特定拼块中级联串流停滞的数量。
- 每个 AI 引擎拼块在“Performance Metrics”视图中均显示为一个条形。停滞百分比越高,条形越偏右。对于最高的条形,应多加关注。单一其中某一个条形即可选中要关注的拼块。
- 底部的“Tiles”(拼块)视图列出了所有 AI 引擎拼块以及有关列、行、内核、缓冲器、所有停滞时间、百分比和计数的信息。您可单击标题列,按特定列排序。 提示: 如果视图中的数值或信息为绿色,则可与其他视图进行交叉探测。
- 在下拉列表旁有个 % 按钮。单击此按钮即可切换停滞的显示形式:百分比或绝对值。
- 在“Performance Metrics”视图中浏览信息时,通常与其他视图进行交叉探测是很有用的。例如:图 2. “Trace”视图
- 选择停滞时间最长的拼块。然后转至“Trace”(追踪)视图以查看停滞的位置和频率。
- 缩放“Trace”视图以获取时间线中停滞的更清晰的视图。
- 单击“Stalls”(停滞)视图并从下拉列表中选择要检验的停滞的类型。选中“Stalls”视图中的停滞即可在“Trace”视图中高亮显示此停滞。
“Performance Metrics”视图、“Trace”视图、“Graph”视图和“Array”视图可彼此交叉探测。“Graph”视图有助于理解 graph 中发生停滞的位置,“Array”视图则有助于查看硬件中对象的位置。在后续章节中,对每一种停滞类型的分析进行了解读并提供了更多详细信息。