赛灵思器件上的 INT4 优化卷积神经网络 (WP521) - 对于 AI 推断,在提供与浮点相媲美的精度的同时,INT8 的性能优于浮点。然而在资源有限的前提下,INT8 却不能满足性能要求,INT4 优化则是解决之道。通过 INT4 优化,与现有的 INT8 解决方案相比,赛灵思在实际硬件上可实现高达 77% 的性能提升。 - WP521

wp521-4bit-optimization.pdf

Document ID
WP521
Release Date
2020-06-24
Revision
1.0.1 简体中文