パフォーマンス メトリクス解析から、解析が必要なカスケード ストールを特定できます。
- Trace ビューを選択します。
- Cascade Stalls ビューを選択します。
- Cascade stall をクリックします。
-
Cascade stall は、Trace ビューでハイライトされます。図 1. Trace ビューのカスケード ストール
各カスケード ストールには、次の情報が含まれます。
- NAME
- ストリーム ストールには、CS_<NUM> という名前が付けられます。発生した順番に番号が付けられます。番号は、ストールのすべてのタイプの間で固有です。
- Stalled Tile
- ストールしたカーネルが存在する AI エンジン タイル。
- Stalled Kernel
- ストールしたカーネル。
<Kernel_function_name>.<Schedule_ID>.<Graph_instance_name>
という名前です。_main
と表示されることもあり、その場合はクロスプローブして実際のカーネル関数を見つける必要があります。 - Start (ps)
- ストールの開始時間。
- Duration (ps)
- ストール時間の長さ。
-
PC
- ストールが発生したときのプログラム カウンター。
- Stalled Port
- ストールしたカーネルのストールしているポート。
- Related Stalls
- ストールを発生させる可能性のあるほかのストール。
- Full Destination
- フルであるためにストールしたカーネルで書き込むことができなかったポート。
- Empty Source
- 空であるためにストールしたカーネルで読み出すことができなかったポート。
Trace ビューでカスケード ストールを調べ、それらがどのように関連しているかを確認します。
- ほかのタイプのストールがカスケード ストールを発生させている可能性があります。ほかのタイプのストールを調べて、何が起こったのかを解析します。Stalls ビューの [Related Stalls] は、カスケード ストールを発生させたストールを示します。
- Graph ビューでストールを表示すると、ストールの原因を特定するのに役立ちます。Graph view を選択します。
- Cascade Stalls ビューを選択します。
- Stalls ビューでパスをクリックすると、そのストール パスが Graph ビューに赤で表示されます。
- カスケード ストールおよび関連のストールを調べると、ストールの原因を特定するのに役立ちます。Related
Stalls をクリックすると、関連のストールも赤で表示されます。たとえば、Related
Stalls の SS_16 をクリックすると、パスが赤で表示され、ストールの開始位置がわかります。図 2. Graph ビューのカスケード ストール
次の表に、カスケード ストールが発生する状況と可能なソリューションを示します。
ソース | デスティネーション | ストール タイプ | 可能なソリューション |
---|---|---|---|
カスケード ストリーム | カスケード ストリーム | カスケード ストール |
|
ストリーム + カスケード ストリーム | ストリーム + カスケード ストリーム | カスケード ストール |
|