你的位置:EETOP 赛灵思(Xilinx) 社区 >> >> 全部 >> 详细内容

浪潮联合Xilinx发布全球首款集成HBM2的FPGA AI加速卡F37X

发布者:jackzhang 时间:2018-10-18 10:08:36

10月16日,在北京举行的2018 XDF赛灵思开发者大会上,浪潮联合赛灵思宣布推出全球首款集成HBM2高速缓存的FPGA AI加速卡F37X,可在不到75W典型应用功耗提供28.1TOPS的INT8计算性能和460GB/s的超高数据带宽,适合于机器学习推理、视频转码、图像识别、语音识别、自然语言处理、基因组测序分析、NFV、大数据分析查询等各类应用场景,实现高性能、高带宽、低延迟、低功耗的AI计算加速。

 

浪潮集团副总裁李金在2018 XDF赛灵思开发者大会发表主题演讲


F37X是浪潮专为AI极致性能设计的尖端FPGA加速卡,它采用Xilinx Virtex UltraScale+架构,提供285万个系统逻辑单元和9024个DSP单元,INT8计算性能达到了28.1TOPS,集成8GB HBM2高速缓存,带宽达460GB/s,相比单DDR4 DIMM提升20倍。当AI计算模型尺寸小于HBM2容量时,可全部预先载入高速缓存之中,消除了外部读写带来的数据传输延迟并提高处理速度,使AI计算完全放到片上成为可能。性能数据显示,浪潮F37X在AI图像识别实时推理场景,基于GoogLeNet深度学习网络模型,当BatchSize=1时性能高达8600 images/s,是CPU性能的40倍。F37X典型应用功耗仅为75瓦,性能功耗比高达375Gops/W。此外,F37X板载24GB DDR4内存及双端口100Gbps高速网络接口。F37X设计为全高半长PCI-E 3.0板卡,紧致的尺寸可使得单台AI服务器支持更多加速卡设备,从而提供极限计算与通信性能。

 

全球首款集成HBM2的FPGA AI加速卡F37X


F37X可支持C/C++、OpenCL和RTL三种主流的编程语言开发环境。相应SDx工具套件内含SDAccel™、Vivado®及SDK工具,应用已有的OpenCV、BLAS、Encoder、DNN、CNN等加速库,实现对主流深度学习框架如Caffe、TensorFlow、Torch、Theano等的支持,覆盖机器学习推理、视频图像处理、数据库分析、金融、安全等典型AI应用领域,提供强大的生态支持,具备更加出色的易编程性,可灵活快速开发和迁移不同的AI定制算法应用,在软件生产力上实现了质的飞跃。


浪潮集团副总裁李金表示:“AI正以前所未有的速度重构产业创新,AI算法将不断快速迭代,线上推理将成为AI计算的主要场景。浪潮一直致力创新FPGA软硬件技术,帮助客户持续获得领先的AI计算竞争力。浪潮F37X加速卡将为全球用户提供快速可定制、实时高性能、高密低功耗的先进的FPGA解决方案,加速AI应用的线上部署。”


赛灵思公司数据中心销售副总裁Freddy Engineer表示:“浪潮因产品执行和创新而享誉全球。浪潮将为客户提供搭载Xilinx加速卡的服务器,我们为此而自豪。我们非常高兴能成为浪潮的开发合作伙伴,联合推出突破性产品F37X,它通过HBM2提供前所未有的内存带宽,将加速数据分析、AI和需要最低延迟数据访问的工作负载。”


浪潮是全球领先的AI计算力厂商,从计算平台、管理套件、框架优化、应用加速等四个层次致力于打造敏捷、高效、优化的AI基础设施。浪潮帮助AI客户在语音、图像、视频、搜索、网络等方面取得数量级的应用性能提升。据IDC《2017年中国AI基础架构市场调查报告》显示,浪潮AI服务器市场份额达57%高居第一。

最新课程

  • 深入浅出玩儿转FPGA

    本视频基于Xilinx公司的Artix-7FPGA器件以及各种丰富的入门和进阶外设,提供了一些典型的工程实例,帮助读者从FPGA基础知识、逻辑设计概念

  • 从零开始大战FPGA基础篇

    本课程为“从零开始大战FPGA”系列课程的基础篇。课程通俗易懂、逻辑性强、示例丰富,课程中尤其强调在设计过程中对“时序”和“逻辑”的把控,以及硬件描述语言与硬件电路相对应的“

  • Verilog基础及典型数字

    课程中首先会给大家讲解在企业中一般数字电路从算法到流片这整个过程中会涉及到哪些流程,都分别使用什么工具,以及其中每个流程都分别做了