我跟着这个tutorial为了量化我的图成8位。我不能在这里分享确切的图,但我可以说这是一个简单的卷积神经网络。 当我在原始和量化网络上运行benchmark tool时,很明显量化网络要慢得多(100 ms vs 4.5 ms)。在原来的网络 最慢的节点:在量化网络 time average [ms] [%] [cdf%] [Op] [Name]
1.198 26.54% 26.54% Mat
我正在MATLAB的矢量量化 正如我们所知在矢量量化中,如果我们提供一组代码字作为输入,我们得到代码向量 所以我做了什么,我用LPG和Loyed算法来做到这一点: - training set=randn(2,100) == code word
distortion=0.001
[code book]=Vector-Quantization (training set