出力は入力バッファーの和 (減算) です。
vector<float,8> fpadd (vector<float,8> acc, vector<float,32> xbuf, int xstart, unsigned int xoffs)
パラメーター | 説明 |
---|---|
acc | 最初の加算入力バッファー。出力と同じ型です。 |
xbuf | 2 つ目の加算入力バッファー。 |
xstart | X の全レーンの開始オフセット。 |
xoffs | レーンあたり 4 ビット: X の追加のレーン依存オフセット。 |
実行された演算は、次のとおりです。
for (i = 0 ; i < 8 ; i++)
ret[i] = acc[i] + xbuf[xstart + xoffs[i]]
使用可能なデータ型は、次のとおりです。
acc:
vector<float,8>, vector<cfloat,4>
xbuf:
vector<float,32>, vector<float,16>, vector<cfloat,16>, vector<cfloat,8>