たとえば、計算をアクセラレーションするのに、データパスの幅を広くして、より多くのサンプルが並列処理されるようにする方法があります。アルゴリズムには、この方法が使えるものと使えないものがあります。アルゴリズムの特性を理解して、この方法が使えるのかどうか、使えるのであれば、パフォーマンス目標を満たすのに並列処理する必要のあるサンプル数がいくつなのかを理解しておくことが重要です。
データパスの幅を広くして、並列処理するサンプル数を多くすると、アクセラレーションされた関数のレイテンシ (実行時間) を削減できるので、パフォーマンスが向上します。