你的位置:EETOP 赛灵思(Xilinx) 社区 >> >> 全部 >> 详细内容

利用 Xilinx 器件的 INT8 优化开展深度学习

发布者:jackzhang 时间:2016-12-08 18:37:05

作者:Yao Fu、Ephrem Wu、Ashish Sirasao、Sedny Attia、Kamran Khan 和 Ralph Wittig


本白皮书旨在探索实现在赛灵思 DSP48E2 Slice 上的 INT8 深度学习运算,以及与 其他 FPGA 的对比情况。在相同资源数量情况下,赛灵思的 DSP 架构凭借 INT8 在 INT8 深度学习每秒运算次数 (OPS) 上相比其它 FPGA,能实现 1.75 倍的峰值 解决方案级性能。由于深度学习推断可以在不牺牲准确性的情况下使用较低位精 度,因此需要高效的 INT8 实现方案。 赛灵思的 DSP 架构和库专门针对 INT8 深度学习推断进行了优化。本白皮书介绍 如何使用赛灵思 UltraScale 和 UltraScale+ FPGA 中的 DSP48E2,在共享相同内 核权重的同时处理两个并行的 INT8 乘法累加 (MACC) 运算。本白皮书还阐述了 要运用赛灵思这一独特技术,为何输入的最小位宽为 24 位。本白皮书还以 INT8 优化技术为例,展示了该技术与神经网络基本运算的相关性。

点击下载白皮书:
https://china.xilinx.com/support/documentation/white_papers/c_wp486-deep-learning-int8.pdf

最新课程

  • 深入浅出玩儿转FPGA

    本视频基于Xilinx公司的Artix-7FPGA器件以及各种丰富的入门和进阶外设,提供了一些典型的工程实例,帮助读者从FPGA基础知识、逻辑设计概念

  • 从零开始大战FPGA基础篇

    本课程为“从零开始大战FPGA”系列课程的基础篇。课程通俗易懂、逻辑性强、示例丰富,课程中尤其强调在设计过程中对“时序”和“逻辑”的把控,以及硬件描述语言与硬件电路相对应的“

  • Verilog基础及典型数字

    课程中首先会给大家讲解在企业中一般数字电路从算法到流片这整个过程中会涉及到哪些流程,都分别使用什么工具,以及其中每个流程都分别做了