Performance Metrics - 2023.2 简体中文

AI 引擎工具和流程用户指南 (UG1076)

Document ID
UG1076
Release Date
2023-12-04
Version
2023.2 简体中文

“Performance Metrics”(性能指标)视图可显示每种类型的停滞占总仿真时间或总停滞计数的百分比。

图 1. “Performance Metrics”视图
  1. 单击“Performance Metrics”视图。
  2. 从下拉列表中选择停滞类型。指标区分不同类型的停滞。它将显示仿真结果中现有的停滞。
    Lock Stall Time (ps)(锁定停滞时间 (ps))
    锁定停滞时间百分比,在此期间获取 AI 引擎拼块内的缓冲器。
    Lock Stall Count(锁定停滞计数)
    特定拼块中锁定停滞的数量。
    Memory Stall Time (ps)(存储器停滞时间 (ps))
    存储器停滞时间百分比,在此期间 AI 引擎拼块内的存储器访问存在冲突。
    Memory Stall Count(存储器停滞计数)
    特定拼块中存储器停滞的数量。
    Stream Stall Time (ps)(串流停滞时间 (ps))
    由于串流已满或为空而导致串流停滞时间的百分比。
    Stream Stall Count(串流停滞计数)
    特定拼块中串流停滞的数量。
    Cascade Stall Time (ps)(级联停滞时间 (ps))
    由于级联串流已满或为空而导致级联串流停滞时间的百分比。
    Cascade Stall Count(级联停滞计数)
    特定拼块中级联串流停滞的数量。
  3. 每个 AI 引擎拼块在“Performance Metrics”视图中均显示为一个条形。停滞百分比越高,条形越偏右。对于最高的条形,应多加关注。单一其中某一个条形即可选中要关注的拼块。
  4. 底部的“Tiles”(拼块)视图列出了所有 AI 引擎拼块以及有关列、行、内核、缓冲器、所有停滞时间、百分比和计数的信息。您可单击标题列,按特定列排序。
    提示: 如果视图中的数值或信息为绿色,则可与其他视图进行交叉探测。
  5. 在下拉列表旁有个 % 按钮。单击此按钮即可切换停滞的显示形式:百分比或绝对值。
  6. 在“Performance Metrics”视图中浏览信息时,通常与其他视图进行交叉探测是很有用的。例如:
    图 2. “Trace”视图
  7. 选择停滞时间最长的拼块。然后转至“Trace”(追踪)视图以查看停滞的位置和频率。
  8. 缩放“Trace”视图以获取时间线中停滞的更清晰的视图。
  9. 单击“Stalls”(停滞)视图并从下拉列表中选择要检验的停滞的类型。选中“Stalls”视图中的停滞即可在“Trace”视图中高亮显示此停滞。

“Performance Metrics”视图、“Trace”视图、“Graph”视图和“Array”视图可彼此交叉探测。“Graph”视图有助于理解 graph 中发生停滞的位置,“Array”视图则有助于查看硬件中对象的位置。在后续章节中,对每一种停滞类型的分析进行了解读并提供了更多详细信息。