パフォーマンス メトリクス - 2023.2 日本語

AI エンジン ツールおよびフロー ユーザー ガイド (UG1076)

Document ID
UG1076
Release Date
2023-12-04
Version
2023.2 日本語

[Performance Metrics] ビューには、合計シミュレーション時間または合計ストール数に対する各タイプのストールの割合が表示されます。

図 1. [Performance Metrics] ビュー
  1. [Performance Metrics] ビューをクリックします。
  2. ドロップダウン リストからストール タイプを選択します。メトリクスは、異なるストール タイプで分類されています。シミュレーション結果にそのストール タイプが存在する場合に表示されます。
    [Lock Stall Time (ps)]
    AI エンジン タイル内のバッファーが取得されるロック ストール時間の割合を示します。
    [Lock Stall Count]
    特定タイルのロック ストールの数を示します。
    [Memory Stall Time (ps)]
    AI エンジン タイル内のメモリ アクセスに競合が発生したメモリ ストール時間の割合を示します。
    [Memory Stall Count]
    特定タイルのメモリ ストールの数を示します。
    [Stream Stall Time (ps)]
    フル ストリームまたは空のストリームによるストリーム ストール時間の割合を示します。
    [Stream Stall Count]
    特定タイルのストリーム ストールの数を示します。
    [Cascade Stall Time (ps)]
    カスケード ストリームがフルか空であるために発生したストリーム ストール時間の割合を示します。
    [Cascade Stall Count]
    特定タイルのカスケード ストリーム ストールの数を示します。
  3. AI エンジン タイルは、[Performance Metrics] ビューにバーで表示されます。ストールの割合が高いほど、バーは右に表示されます。長いバーに注意を払う必要があります。バーの 1 つをクリックしてハイライトします。
  4. 一番下の表には、すべての AI エンジン タイルの列、行、カーネル、バッファー、およびすべてのストール時間、割合、数が一覧表示されます。タイトル行をクリックすると、その列で並べ替えできます。
    ヒント: ビュー内の番号または情報が緑色でハイライトされている場合、ほかのビューとクロスプローブできます。
  5. ドロップダウン リストの横に [%] ボタンがあります。このボタンをクリックすると、ストールの表示を割合 (%) または絶対値に切り替えることができます。
  6. [Performance Metrics] ビューの情報を確認中、ほかのビューとクロスプローブすると便利です。次に例を示します。
    図 2. [Trace] ビュー
  7. ストール時間が最長のタイルを選択します。[Trace] ビューに移動し、ストールの位置と頻度を確認します。
  8. [Trace] ビューを拡大/縮小して、タイムラインの表示を調整します。
  9. [Stalls] ビューをクリックし、ドロップダウンリストから確認するストールのタイプを選択します。[Stall] ビューでストールを選択し、[Trace] ビューでハイライトします。

[Performance Metrics] ビュー、[Trace] ビュー、[Graph] ビュー、および [Array] ビューは、相互にクロスプローブできます。[Graph] ビューは、グラフ内のストールの発生場所を理解するのに役立ち、[Array] ビューは、ハードウェア内のオブジェクトの位置を表示するのに役立ちます。各ストール タイプの解析に関する詳細は、この後のセクションで説明します。