説明
syn.directive.performance
は、ループとループ ネストに適用され、パフォーマンスを決定するためには、既知のループ トリップカウントが必要です。ループに tripcount 変数が含まれる場合は、syn.directive.tripcount
も指定する必要があります。
syn.directive.performance
を使用すると、ループの連続した開始間のクロック サイ クル数を定義する高位レベルの制約 (target_ti
または target_tl
) を指定し、目的の結果を得るために必要な下位レベルの UNROLL、PIPELINE、ARRAY_PARTITION、および INLINE 指示子をツールで推論できます。syn.directive.performance
を指定される値は必ず達成されとは限らず、あくまでもターゲットです。
target_ti
は、ループの連続した開始間隔、またはループの最初の反復の開始と、次のループの最初の反復の開始の間の間隔です。次のコード例では、target_ti=T
は L1
の連続する 2 回の反復間の L2
ループ開始の目標間隔が 100 サイクルである必要があることを示しています。
const int T = 100;
L1: for (int i=0; i<N; i++)
L2: for (int j=0; j<M; j++){
#pragma HLS PERFORMANCE target_ti=T
...
}
target_tl
は、ループの開始から終了までの間隔、またはループの最初の反復の開始からループの最後の反復の完了までの間隔です。前述のコード例の場合、target_tl=T
は、L1
1 回の反復間の L2
ループの目標が 100 サイクルである必要があることを示しています。
syn.directive.inline
は、II=1 を実現するパイプライン処理されたループ内の関数に自動的に適用され、スループットを向上させます。II=1 でパイプラインを推論する PERFORMANCE プラグマや指示子を適用した場合、自動インライン最適化もトリガーされます。特定の関数に対してこのインライン最適化をディスエーブルにするには、syn.directive.inline
off
を使用します。トランザクション間隔は、ループの開始間隔 (II) に反復回数 (tripcount) を掛けた値 (target_ti = II * loop tripcount) になります。逆に、target_ti
は FreqHz/毎秒ごとの演算になります。
たとえば、呼び出しごとに 1 つのフレームを処理する画像処理関数のスループット目標が 60 fps の場合、関数のターゲット スループットは毎秒 60 呼び出しになります。クロック周波数が 180 MHz の場合、target_ti
は、関数呼び出しごとに 180M/60 なので、300 万クロックサイクルになります。
構文
ループの指示子を指定します。
syn.directive.performance=<location> [Options]
説明:
<location>
は function/loop_label
形式でループを指定します。
オプション
-
target_ti=<value>
- 反復を完了するためのループのクロック サイクル数として定義されたターゲット トランザクション間隔を指定します。トランザクション間隔とは、ループの最初のトランザクションまたはネストされたループから、ループの次のトランザクションの開始までのクロック サイクル数です。<value> は、整数、浮動小数点、または定数式として指定できます。この式は、ツールによって整数に変換されます。 注記: 切り捨てがあった場合は、警告メッセージが表示されます。
-
target_tl=<value>
-
ループがすべての反復を完了するまでのクロック サイクル数として定義されるターゲット レイテンシを指定します。トランザクション レイテンシは、ループの最初の反復の開始から、ループの最後の反復の完了までの間隔のことです。<value> は、整数、浮動小数点、または定数式として指定できます。この式は、ツールによって整数に変換されます。
- unit=[sec | cycle]
-
target_ti
またはtarget_tl
の値に対する単位を指定します。単位は秒かクロック サイクルで指定できます。単位が秒の場合は、ナノ秒 (ns)、ピコ秒 (ps)、マイクロ秒 (us) を指定できます。
例 1
loop_1
とラベルが付けられているループは、ターゲット トランザクション間隔を 4 クロック サイクルにするように指定されています。
syn.directive.performance=loop_1 target_ti=4