作者:Steve Leibson, 赛灵思战略营销与业务规划总监
在所有Zynq All Programmable SoC 的内部, 你都会发现一个双核的ARM Cortex -A9 MPCore处理器,而且Zynq SoC中的这两个处理器中都设有ARM NEON SIMD架构扩展集。那么为什么您需要采用ARM NEON SIMD扩展集呢?那是因为你可以因此大幅提升你的软件性能。你可能看不到您把关键任务转入Zynq SoC可编程逻辑所获得的那么大幅的加速,但是在很多应用中您都会看到某种加速现象。
诀窍就在于NEON扩展集的使用!
这一特殊决窍的秘诀在于 Project Ne10的NE10开源库。设立Ne10项目的目的是提供一套通用、有效的函数,可以大大优化ARM架构,包括NEON SIMD扩展集,并提供统一且便于测试的操作,以便融合到应用中。这个开源库支持静态链接和动态链接,并且是模块化的,因此不需要将未曾使用的库代码添加 到您编写的代码脚本中。
以下是目前NE10开源库当中可使用的函数列表:
FIR滤波器
FIR抽取器
FIR插入
复数FFT
实数FFT
格型IIR滤波器
FIR格型
稀疏矩阵FIR滤波器
点积
矢量加法
矢量减法
矢量累加
矢量除法
矢量集
矢量长度
矢量标准化
矢量属性
十字型矢量
矩阵的加法
矩阵的减法
矩阵的乘法
矩阵的除法
矩阵向量乘法
矩阵转置
矩阵行列式
逆矩阵
矩阵转置
单位矩阵
下图显示了一组FFT函数,展示了使用NEON扩展集和Ne10库与使用NEON内联函数及ARMCC编译器生成矢量代码的性能对比。
原文链接: http://forums.xilinx.com/t5/Xcell-Daily-Blog/Leverage-the-ARM-NEON-SIMD-...
本视频基于Xilinx公司的Artix-7FPGA器件以及各种丰富的入门和进阶外设,提供了一些典型的工程实例,帮助读者从FPGA基础知识、逻辑设计概念
本课程为“从零开始大战FPGA”系列课程的基础篇。课程通俗易懂、逻辑性强、示例丰富,课程中尤其强调在设计过程中对“时序”和“逻辑”的把控,以及硬件描述语言与硬件电路相对应的“
课程中首先会给大家讲解在企业中一般数字电路从算法到流片这整个过程中会涉及到哪些流程,都分别使用什么工具,以及其中每个流程都分别做了
@2003-2020 中国电子顶级开发网