DSP - 2024.2 日本語 - XD100

Vitis チュートリアル: AI エンジン開発 (XD100)

Document ID
XD100
Release Date
2024-12-06
Version
2024.2 日本語

このデザインの場合、1024 個の DSP58 エンジンのシストリック アレイを使用して、行列乗算がインプリメントされています。DSP58 のカスケード チェーンは 32 本あり、チェーンごとに 32 個の DSP58 が含まれています。行列と行列の乗算は、行列とベクターの乗算に分解されます。1 つの行列 B の列ベクターは行列 A の各行に乗算されます。これは、行列 B の列ベクターを各カスケード チェーンの同じ位置にある DSP にブロードキャストし、行列 A の 1K エレメントすべてを読み出し、各エレメントが DSP58 のポート A を 1 つ駆動することで達成されます。1 つのカスケード チェーンで、1 列のベクターと 1 行のベクターの乗算をインプリメントします。この動作は 32 クロックで完了します。

このため、32x32 の行列が基本的な行列の乗算単位となります。より大きな行列の場合は、サイズ 32x32 の部分行列に分解され、行列 A の各 32x32 の部分行列と行列 B の各部分行列が乗算されます。より大きな行列の乗算では、部分和を保存し、読み出し、新しい値に加算して保存し直す必要があります。

ディレクトリ構造