コードアナライザーの使用

コードアナライザーの使用 - 2023.2 日本語

Vitis 高位合成ユーザーガイド (UG1399)

Document ID

UG1399

Release Date

2023-12-18

Version

2023.2 日本語

高位合成 (HLS) で最良の結果を得るには、デザインのマクロアーキテクチャを改善するコード変更が必要になることが多くあります。これをしやすくするため、Vitis HLS コードアナライザーからは、タスクレベルの並列処理の可能性を視覚化し、パフォーマンスを最適化するのに必要なアーキテクチャの変更を理解できる機能が提供されています。

C シミュレーション設定で説明されるように、HLS コンフィギュレーションファイルで csim.code_analyzer コマンドを有効にすると、C シミュレーション手順の一部としてコードアナライザーを実行できます。実行すると、コードアナライザーレポートが Flow Navigator の C シミュレーションステップのレポート、または Vitis Unified IDE の [Analysis] ビューで使用できるようになります。コードアナライザーには次の機能があります。

データフローグラフの抽出: コードアナライザーレポートは、最上位のステートメントがデータフロープロセス (DFG ノード) になり、これらのプロセスのデータ依存関係がデータフローチャネル (DFG エッジ) になるデータフローグラフ (DFG) を抽出します。このグラフは、関数やループ本体がデータフローでない場合でも生成でき、HLS 用のプログラミングモデルで説明されるように、コードをデータフロー形式でどのように書き換えればよいかを判断するのに役立ちます。
パフォーマンスメトリクス: データ量、トランザクション間隔 (TI)、スループットなどのパフォーマンスメトリクスは、コードアナライザーで決定されます。データ量とアクセスモードは、プロファイル情報に基づいて C テストベンチから決定できます。たとえば、変数 A が 32 ビット幅のポートが推論され、プロセス 2 で読み出される前にプロセス 1 で 8 Kb のデータを書き込むように決定されます。合成前にデザインを解析する場合、コードアナライザーがトランザクション間隔 (データ転送が完了するまでの時間) とチャネルのスループットを見積もります。ただし、この推論は合成前に実行されるので、合成された RTL のパフォーマンスから計算する場合よりも精度は落ちます。
パフォーマンスガイダンス: HLS コンポーネントのソースコードに含まれる可能性のある主なパフォーマンスブロッカーを特定します。これらのブロッカーには、サイクル依存やメモリポートの競合が含まれます。パフォーマンスガイダンスは、デザインのパフォーマンスを制限する可能性のあるコード構造を理解したり、デザインが達成できるパフォーマンスレベルを理解するのに役立つメトリクスを特定したりするのに役立ちます。
グラフの変換: データフローグラフの分解と、測定されたメトリクスと見積もられたメトリクスに基づいて、グラフが表示されるように理想的でないとわかることがあります。プロセスをマージしてグラフを修正すると、What-if タイプのデザイン確認を実行できます。グラフが変更されると、新しいアーキテクチャから新しいパフォーマンスメトリクスが決定されます。このデザインプロセスを繰り返すことで、理想的に構築されたソリューションの青写真ができるので、それを基にソースコードをリファクタリングできます。; 重要: コードはコードアナライザーレポートでマージしたり分割したりできますが、引き継ぐ変更は元のデザインのソースコードに手動で再インプリメントする必要があります。

コードアナライザーレポートの使用

コードアナライザーを有効にして C シミュレーションコマンドを実行すると、コードアナライザーレポートが生成され、Vitis Unified IDE の [Analysis] ビューまたは Flow Navigator の [Reports] ヘッダーの下に表示できます。コードアナライザーレポートは、次の例に示すように、コンポーネントの最上位関数で定義されたプロセスとチャネルのグラフを最初に表示します。ツールバーメニューの Function セレクターを使用するか、グラフ内の展開されたプロセスで右矢印をクリックすることで、レポートの範囲を変更できます。

図 1. コードアナライザーレポート

コードアナライザーレポートの機能は、次のとおりです。

Graph

レポートの [Graph] ビューは、デザインのプロセスとチャネルをデータフローグラフで表示します。これは、DATAFLOW プラグマや指示子がソースコードに存在しなくても、その存在を推論します。各プロセスには、そのエレメントのトランザクション間隔とパフォーマンスガイダンスが表示され、[Code] ビューを展開すると、そのエレメントのソースコードも表示できます。次の例では、合成前の解析で見積もられたパフォーマンスを表示しています。データフロープロセス (グラフノード) では、TI が右上に黄色/赤色のボックスで表示されます。

データフロープロセスを形成するコード内の関数呼び出しやループにも、呼び出しやループのヘッダーの直後にパフォーマンスメトリクスが表示されます。このループや関数呼び出しのパフォーマンスのブロッキング要因を特定する追加ガイダンスの詳細リンクがあることもあります。

さらに、プロセスヘッダーで右クリックし、Goto Source コマンドを選択すると、そのソースファイルが開いて、ソースコードがハイライトされます。

表

コードアナライザーレポートには、グラフの下に [Processes] と [Channels] の 2 つのタブのある表が表示されます。さまざまなエレメントの簡単なサマリが表示されるので、1 つの表で解析結果を確認できます。

[Processes] タブにはグラフのプロセスが表示され、合成前のトランザクション間隔 (TI) の見積もり値も表示され、解析によってはデザインガイダンスも生成されて表示されます。
[Channels] タブには、各プロセスに出入りするデータフローチャネルが行別に表示されます。チャネルは、それを定義する変数の名前にちなんで命名され、ビット幅、チャネルを介して送信されるはずのデータ量、予測されるスループット、アクセスモード、プロデューサーおよびコンシューマータスクまたはプロセスなどの変数宣言の詳細が記述されます。

ツールバー

コードアナライザーレポートのツールバーメニューには、レポートの設定や表示に役立つコマンドが多数用意されています。

前の図は、左から順に次のコマンドを表示しています。

Zoom In/Zoom Out/Zoom Fit: 必要に応じてグラフ図を拡大/縮小/全体表示します。
Toggle Table: プロセスおよびチャネルの表を表示または非表示にします。これにより、必要に応じてグラフのスペースを確保できます。
Collapse All: グラフ内の展開されたプロセスを閉じます。
Group All/Ungroup All: ソースとデスティネーションが同じチャネルをグループにしたり、グループを解除したりします。
Function: 現在のグラフの内容を表示します。内容を変更するには、リストから新しい関数を選択するか、プロセスのコード内のループや関数呼び出しの横にある矢印をクリックします。
Heat Map: ループまたはプロセスのトランザクション間隔 (TI) またはパフォーマンスガイダンスメッセージとして、グラフのレポートデータを指定します。TI の場合、最大の結果が赤でハイライトされますが、これはこれらのプロセスが最も遅く、データフロー領域全体のパフォーマンスを制限していることを示しています。
Properties: パフォーマンスのボトルネックを表示するパネルの表示/非表示を切り替えます。パネルの内容は、プロセスのコードにある Details リンクをクリックすると設定されます。
Info: ツールの使用に関連する情報、返されたメトリクス、またはデザインの一般的な注意事項を提供します。これは、ときどき確認することをお勧めします。
Settings: グラフのスループット単位とエッジラベルを指定します。使用可能な単位は、毎 (サイクルまたは秒) あたり (ビットまたはバイト) です。また、Channel Volume Filter を設定してデータ量の下限を指定すると、低データ信号 (たとえば制御信号) をグレーアウトすることもでき、高データチャネルに集中できるようになります。

概要表示

[Overview] はグラフ全体の縮図で、グラフの個別箇所への参照が含まれており、グラフを拡大すると、その箇所を表示できます。[Overview] を使用すると、バウンダリを操作してグラフの表示を管理できます。必要であれば [Overview] を閉じてグラフのスペースを空けることもできます。

グラフの操作

デザインを開始する際には、HLS コンポーネントのソースコードを深く理解し、主要なプロセスと、これらのプロセス間の依存関係を特定する必要があります。コードアナライザーは、C シミュレーションの出力としてコードをデータフローグラフで表示することで、これをサポートします。

コードアナライザーレポートには、各プロセスのトランザクション間隔 (TI) が表示され、最も大きな TI がヒートマップに赤い背景で表示されます。赤はデザインの問題部分を示します。ただし、このグラフで使用される合成前の見積もりは、合成後やインプリメンテーション後のメトリクスと同じ精度にはなりません。コードアナライザーを使用すると、パフォーマンスの可能性をすばやく判断し、問題を特定して解決できます。より正確な情報が必要な場合は、合成とインプリメンテーションを実行してください。

ソースコード内の連続したプロセスをマージして、デザインのさまざまなデータフロー構造を調べて、必要に応じてコードを分割して別々のプロセスに戻すことができます。1 つのプロセスを 2 つ目のプロセスにドラッグアンドドロップするだけで、両プロセスをマージできます。元のソースコードでは、プロセスはシーケンシャルである必要がありました。次の図は、マージされた 2 つのプロセスを示しており、コード内の SPLIT 行をクリックすると、再び分割できるようになりました。

現在のデザインに大きなボトルネックがあって、それをデータフロー領域にする場合は、グラフの焦点を関数またはループ本体に戻して、デザインの解析を続けることができます。計画的に問題解決に取り組んで、コードアナライザーを最大限に活用してください。

最終的には、コードをデータフロー形式で書き直して、コードアナライザーの結果を反映させる必要があります。通常は、プロセスを独自の関数でアウトライン化し、関数、ループ、または領域にデータフロープラグマを追加する必要があります。このプロセスは、グラフ内のすべてのプロセスで Goto Source をクリックし、選択したソースコード上で右クリックし、Refactor を選択すると高速化できます。

ユースケース

正当性

コードアナライザーを使用すると、正規形式および正規本体で説明されるような記述の正当性の問題を、合成前にデータフローデザイン上で特定できます。重要な問題点は、次のとおりです。

読み出しおよび書き込みインターフェイスは、Start ノードから開始されるチャネル、または End ノードに向かうチャネル上の "R+W" アクセスから見つけることができます。
複数のプロデューサー/コンシューマー違反は、チャネル名で並べ替えて、同じ変数を持つ複数のチャンネルを特定すると、表から見つけることができます。Start ノードと End ノードへのアクセスは、通常却下できます。
フィードバックループは、表内の "R → W" (または "R+W → W") モードのチャネルアクセスで見つけることができます。この解析は、チャネルのタイプによって補完すると、正しいフィードバックチャネルと不正なフィードバックチャネルを区別できます。
アウトライン以外のプロセスは、プロセスコードから識別できます。ユーザーは、最上位のデータフロー領域で、プロセスごとに 1 つの関数呼び出しを実行することを目標とし、この呼び出しでは、可能な限り、変数または定数を引数として使用するようにしてください。

これらの問題はコード内で直接修正でき、C シミュレーションを新たに実行すると、更新されたメトリクスと構造でグラフが更新されます。

パフォーマンスの向上

データフロー領域のパフォーマンスで重要な要素のひとつは、その領域を構成するプロセスの TI です。コードアナライザーを使用すると、HLS 合成なしでデータフロープロセスのパフォーマンスを効率的に改善できます。

ツールバーメニューの Heat Map の選択肢から Performance Guidance を選択すると、グラフノードに表示される問題バッジを使用して、パフォーマンスに問題があるプロセスを特定できます。プロセスコードを展開すると、プロセスで見つかった特定の問題の詳細が示されます。これらの問題を調べて、実現可能性、これらの問題の場所、最終的なパフォーマンス目的に応じて、対処するかどうかを決めてください。たとえば、ある特定のプロセスの内部ループで II=1 にする場合、その特定のループのネストで提示されるすべての問題を修正するには、コードを書き直す必要があります。

関連するユースケースとして、目的が学ぶことであっても検証することであっても、特定のプロセスで TI がどのように計算されたかを理解する必要があることがあります。関数呼び出しとループの横にある TI と II のアノテーションは、この目的のためにプロセスのソースコードをインライン展開して確認できます。

スループット解析

コードアナライザーは、チャネルのスループットの見積もりを表示します。解析を補完し、デザインパフォーマンスをより理解するため、チャネル幅とその量 (領域の実行あたりの総アクセス) にアクセスすることもできます。ただし、できるだけデザインを合成してスループットの見積もりを検証する必要があります。これは、コードアナライザーが、ほかの合成後やインプリメンテーション後のメトリクスよりも精度の低い合成前の見積もりを使用するからです。

コード アナライザー レポートの使用

グラフの操作

ユース ケース

コードアナライザーレポートの使用

ユースケース