メモリ モジュールのプロファイリング - 2023.2 日本語

AI エンジン ツールおよびフロー ユーザー ガイド (UG1076)

Document ID
UG1076
Release Date
2023-12-04
Version
2023.2 日本語

次の表に、メモリ モジュールに使用可能な定義済みメトリクス セットの設定を示します。xrt.ini ファイルでは、これらのメトリクス名はすべて小文字で、次のメトリクス セレクターのいずれかに割り当てられている必要があります。

  • tile_based_aie_memory_metrics
  • graph_based_aie_memory_metrics
表 1. conflicts
メトリクス名 イベント ID 説明
Memory Conflict 76 メモリ モジュールの 8 個のバンクのいずれかでデータ メモリの競合が発生した時間。
注記: ハードウェア ビューは、128 ビット幅の 8 バンクです。ソフトウェア ビューは、256 ビット幅の 4 バンクです。
Cumulative Memory Errors 86 データ メモリ バンク、2 つの MM2S、2 つの S2MM DMA のいずれかで ECC エラーが発生した時間。

メモリ競合は、2 つのメモリ チャンクが同じメモリ バンクに存在し、同じ AI エンジン (2 つの読み出しポートを使用) または 2 つの異なる AI エンジンによってアクセスされた場合に発生します。これらのメモリの位置を異なるバンクに制約することが考えられる 1 つのソリューションです。これらの競合の原因となっているバンクの詳細を取得するには、エミュレーション/AI エンジン シミュレーションからイベントを解析する必要があります。

表 2. dma_locks
メトリクス名 イベント ID 説明
Cumulative DMA Activity 20 DMA の MM2S および S2MM チャネルの両方でロック取得がストールした時間。
Cumulative DMA Lock Count 43 DMA チャネルでのロック ストール回数。

4 つの DMA チャネル (2 つの S2MM と 2 つの MM2S) は、バッファー ディスクリプターにより駆動されます。Cumulative DMA Activity (累積 DMA アクティビティ) は、すべてのチャネルでロック取得イベントがストールした累積時間です。これらの DMA イベントはすべて、デバイスを介した一部の接続が予測よりも遅い理由を理解するのに役立ちます。

表 3. dma_stalls_s2mm
メトリクス名 イベント ID 説明
S2MM Channel 0 Stalls 33 S2MM チャネル 0 がロック取得でストールした時間。
S2MM Channel 1 Stalls 34 S2MM チャネル 1 がロック取得でストールした時間。
表 4. dma_stalls_mm2s
メトリクス名 イベント ID 説明
MM2S Channel 0 Stalls 35 MM2S チャネル 0 がロック取得でストールした時間。
MM2S Channel 1 Stalls 36 MM2S チャネル 1 がロック取得でストールした時間。
表 5. write_throughputs
メトリクス名 イベント ID 説明
DMA S2MM チャネル 0 のパケット数 25 DMA S2MM チャネル 0 を介して書き込まれたパケットの数。
DMA S2MM チャネル 1 のパケット数 26 DMA S2MM チャネル 1 を介して書き込まれたパケットの数。
DMA S2MM チャネル 0 のスループット 派生 DMA S2MM チャネル 0 を介する書き込みスループット。このスループットは、アクティブ時間に対して計算されます。
DMA S2MM チャネル 1 のスループット 派生 DMA S2MM チャネル 1 を介する書き込みスループット。このスループットは、アクティブ時間に対して計算されます。

これらのメトリクスにより、DMA S2MM がどれだけ効率的に使用されるかを理解できます。

注記: DMA S2MM を DMA FIFO モードで使用している場合は、このメトリクス セットで使用可能な結果は得られません。
表 6. read_throughputs
メトリクス名 イベント ID 説明
DMA MM2S チャネル 0 のパケット数 27 DMA MM2S チャネル 0 を介して読み出されたパケットの数。
DMA MM2S チャネル 1 のパケット数 28 DMA MM2S チャネル 1 を介して読み出されたパケットの数。
DMA MM2S チャネル 0 のスループット 派生 DMA MM2S チャネル 0 を介する読み出しスループット。このスループットは、アクティブ時間に対して計算されます。
DMA MM2S チャネル 1 のスループット 派生 DMA MM2S チャネル 1 を介する読み出しスループット。このスループットは、アクティブ時間に対して計算されます。

これらのメトリクスにより、DMA MM2S がどれだけ効率的に使用されるかを理解できます。

注記: DMA MM2S を DMA FIFO モードで使用している場合は、このメトリクス セットで使用可能な結果は得られません。