计算机硬件技术论文_面向ZYNQ SoC的卷积神经网
文章摘要:近年来,卷积神经网络逐步应用于工业生产、自动驾驶和航天航空等领域。随着卷积神经网络结构复杂度的不断提高,将其部署到现场可编程门阵列(Field Programmable Gate Array,FPGA)时存在参数量较大、访存次数较多等问题,导致硬件资源消耗较大。因此,提出了一种基于参数量化的卷积神经网络加速器。该加速器对参数进行了8位定点量化和重新排序,有效的减少了内存占用和访存次数,提高了带宽的利用率;同时,该研究采用滑动窗口间并行策略进行加速,提高了图像分类速度。实验结果表明,在Xilinx ZYNQ XC7Z100上实现此加速器,处理一张图片所需要的时间为15.10ms,平均性能为80.88GOPS,性能密度为0.47。与其他卷积神经网络加速器相比,性能密度提升了1.14-1.76倍。
文章关键词:
论文分类号:TP332;TP183
上一篇:自动化技术论文_面向QoS需求的分簇自组织网络
下一篇:没有了