Save Argmax オプションを使用すると、出力を DDR 空間に回復する際に、チャネルの次元に沿った Argmax および Max が有効になります。セグメンテーションのように、最大値のインデックスだけが必要な場合は、モデルの softmax を argmax に置き換えることで、Exp 計算を省略して遅延を削減できます。
DPUCZDX8G のアーキテクチャ | 追加の LUT 数 | 追加のレジスタ数 |
---|---|---|
B512 | 422 | 556 |
B800 | 399 | 547 |
B1024 | 460 | 546 |
B1152 | 503 | 631 |
B1600 | 590 | 640 |
B2304 | 803 | 442 |
B3136 | 832 | 758 |
B4096 | 735 | 389 |