[Performance Metrics] ビューには、合計シミュレーション時間または合計ストール数に対する各タイプのストールの割合が表示されます。
図 1. [Performance Metrics] ビュー
- [Performance Metrics] ビューをクリックします。
- ドロップダウン リストからストール タイプを選択します。メトリクスは、異なるストール タイプで分類されています。シミュレーション結果にそのストール タイプが存在する場合に表示されます。
- [Lock Stall Time (ps)]
- AI エンジン タイル内のバッファーが取得されるロック ストール時間の割合を示します。
- [Lock Stall Count]
- 特定タイルのロック ストールの数を示します。
- [Memory Stall Time (ps)]
- AI エンジン タイル内のメモリ アクセスに競合が発生したメモリ ストール時間の割合を示します。
- [Memory Stall Count]
- 特定タイルのメモリ ストールの数を示します。
- [Stream Stall Time (ps)]
- フル ストリームまたは空のストリームによるストリーム ストール時間の割合を示します。
- [Stream Stall Count]
- 特定タイルのストリーム ストールの数を示します。
- [Cascade Stall Time (ps)]
- カスケード ストリームがフルか空であるために発生したストリーム ストール時間の割合を示します。
- [Cascade Stall Count]
- 特定タイルのカスケード ストリーム ストールの数を示します。
- 各 AI エンジン タイルは、[Performance Metrics] ビューにバーで表示されます。ストールの割合が高いほど、バーは右に表示されます。長いバーに注意を払う必要があります。バーの 1 つをクリックしてハイライトします。
- 一番下の表には、すべての AI エンジン タイルの列、行、カーネル、バッファー、およびすべてのストール時間、割合、数が一覧表示されます。タイトル行をクリックすると、その列で並べ替えできます。 ヒント: ビュー内の番号または情報が緑色でハイライトされている場合、ほかのビューとクロスプローブできます。
- ドロップダウン リストの横に [%] ボタンがあります。このボタンをクリックすると、ストールの表示を割合 (%) または絶対値に切り替えることができます。
- [Performance Metrics] ビューの情報を確認中、ほかのビューとクロスプローブすると便利です。次に例を示します。図 2. [Trace] ビュー
- ストール時間が最長のタイルを選択します。[Trace] ビューに移動し、ストールの位置と頻度を確認します。
- [Trace] ビューを拡大/縮小して、タイムラインの表示を調整します。
- [Stalls] ビューをクリックし、ドロップダウンリストから確認するストールのタイプを選択します。[Stall] ビューでストールを選択し、[Trace] ビューでハイライトします。
[Performance Metrics] ビュー、[Trace] ビュー、[Graph] ビュー、および [Array] ビューは、相互にクロスプローブできます。[Graph] ビューは、グラフ内のストールの発生場所を理解するのに役立ち、[Array] ビューは、ハードウェア内のオブジェクトの位置を表示するのに役立ちます。各ストール タイプの解析に関する詳細は、この後のセクションで説明します。